Google wprowadza AI do Lens

Google ulepsza swoją aplikację do wyszukiwania wizualnego, Lens, dodając możliwość odpowiadania na pytania o otoczenie w czasie zbliżonym do rzeczywistego.

Użytkownicy Androida i iOS mówiący po angielsku, którzy mają zainstalowaną aplikację Google, mogą teraz rozpocząć nagrywanie wideo za pomocą Lens i zadawać pytania dotyczące obiektów znajdujących się w wideo.

Lou Wang, dyrektor ds. zarządzania produktem dla Lens, powiedział, że funkcja korzysta ze „spersonalizowanego” modelu Gemini do interpretacji wideo i odpowiednich pytań. „Załóżmy, że chcesz dowiedzieć się więcej o interesujących rybach,” powiedział Wang podczas briefingu prasowego. „[Lens] wygeneruje przegląd, który wyjaśni, dlaczego pływają w kółko, wraz z dodatkowymi zasobami i przydatnymi informacjami.”

Aby uzyskać dostęp do nowej funkcji analizy wideo w Lens, należy zarejestrować się w programie Search Labs Google oraz wyrazić zgodę na korzystanie z eksperymentalnych funkcji „AI Overviews and more” w Labs. W aplikacji Google przytrzymanie przycisku migawki smartfona aktywuje tryb nagrywania wideo w Lens.

Zadaj pytanie podczas nagrywania wideo, a Lens poda odpowiedź dostarczoną przez AI Overviews, funkcję w Google Search, która wykorzystuje AI do podsumowywania informacji z internetu.

Według Wanga, Lens wykorzystuje sztuczną inteligencję do określania, które klatki w wideo są najbardziej „interesujące” i istotne – a przede wszystkim, które są związane z zadanym pytaniem – i wykorzystuje je do „uzasadnienia” odpowiedzi z AI Overviews. „Wszystko to wynika z obserwacji, jak ludzie obecnie próbują korzystać z takich narzędzi jak Lens,” powiedział Wang. „Jeśli obniżysz barierę zadawania tych pytań i pomagania ludziom zaspokoić ich ciekawość, ludzie naturalnie zaczną z tego korzystać.”

Wprowadzenie funkcji wideo dla Lens następuje po podobnej funkcji, którą Meta zaprezentowała w zeszłym miesiącu dla swoich okularów AR, Ray-Ban Meta. Meta planuje wprowadzenie możliwości analizy wideo w czasie rzeczywistym do tych okularów, umożliwiając użytkownikom zadawanie pytań dotyczących otoczenia (np. „Jaki to rodzaj kwiatu?”).

OpenAI również zapowiedziało funkcję, która umożliwia narzędziu Advanced Voice Mode rozumienie wideo. Ostatecznie Advanced Voice Mode – premium funkcja ChatGPT – będzie w stanie analizować wideo w czasie rzeczywistym i uwzględniać kontekst w odpowiedziach.

Oprócz analizy wideo, Lens może teraz również wyszukiwać za pomocą obrazów i tekstu jednocześnie. Użytkownicy anglojęzyczni, w tym ci, którzy nie są zapisani do Labs, mogą uruchomić aplikację Google i przytrzymać przycisk migawki, aby zrobić zdjęcie, a następnie zadać pytanie, mówiąc na głos.

Pobierz ebook "E-book: Sklep internetowy dla małej firmy"

Napisz komentarz

Zaloguj się, a jeśli nie masz jeszcze konta w Interaktywnie.com - możesz się zarejestrować albo zalogować przez Facebooka.

× Trwa zapisywanie komentarza...

× Twój komentarz został dodany!

Komentarze (0)

wizytówki firm: szukasz klientów dla firmy?

cyber_Folks S.A

W 1999 roku stworzyliśmy jedną z pierwszych firm hostingowych w Polsce. Od tego czasu …
Zobacz profil w katalogu firm »

TBMS Digital Marketing Agency

Projektujemy i wdrażamy strony internetowe - m.in. sklepy, landing page, firmowe. Świadczymy usługi związane …
Zobacz profil w katalogu firm »

Zarejestruj domenę w bardzo dobrej cenie

Skorzystaj z kodu rabatowego redakcji Interaktywnie.com i zarejestruj taniej w Nazwa.pl swoją domenę. Aby …
Zobacz profil w katalogu firm »

NuOrder

Pozycjonujemy się jako alternatywa dla agencji sieciowych, oferując konkurencyjną jakość, niższe koszty i większą …
Zobacz profil w katalogu firm »

Zamów hosting lub serwer w dobrej cenie

Interaktywnie.com jako partner Cyber_Folks, jednego z wiodących dostawców rozwiań hostingowych w Polsce może zaoferować …
Zobacz profil w katalogu firm »