Google Lens: AI-drevet video- og stemmesøgning, hvordan man bruger det og alle dets hemmeligheder

Sidste ændring: 9 May 2025
Forfatter: Joaquin Romero
  • Google Lens-videosøgning muliggør kontekstuelle svar i realtid drevet af AI.
  • Det er muligt at konsultere via stemme eller tekst, mens videoen optages, hvilket udvider mulighederne for interaktion.
  • Funktionen er afhængig af Gemini-modellen til at fortolke billeder, lyd og multimodal kontekst for hver forespørgsel.

Google Lens AI-videosøgning

Google Lens Det er blevet et vigtigt Google-værktøj til at søge efter information fra din mobiltelefon og integrerer nu en revolutionerende opdatering: Søg højt gennem videoer og spørgsmål takket være kunstig intelligens. Denne funktion markerer et spring fremad fra traditionel billedsøgning og ændrer radikalt den måde, vi interagerer med verden omkring os på. Her vil du opdage, hvordan det fungerer, hvad det bruges til, hvordan du bruger det trin for trin, dets fordele, begrænsninger og alle dets hemmeligheder, med detaljerede forklaringer og nyttige tips.

Hvad er Google Lens, og dets udvikling mod multimodal videosøgning?

Siden lanceringen Google Lens har gjort det muligt at identificere objekter, tekster, dyr, planter, produkter eller monumenter. blot ved at pege mobilkameraet. Blandt dens mest populære funktioner er øjeblikkelig tekstoversættelse, løse matematiske problemer, scanne QR-koder og sammenligne produkter i både fysiske butikker og onlinebutikker.

Over tid, Google Lens integrerede nye teknologier såsom stemmegenkendelse og multimodal søgning, og kan bruges i andre apps i Googles økosystem, såsom Maps, Fotos eller Chrome. Dens funktionalitet er ikke begrænset til billeder taget på det tidspunkt, men omfatter også gemte fotos, udvalgte tekster og nu videoer optaget direkte fra appen.

Den vigtigste nuværende fremgang ligger i Evnen til at analysere korte videoer, fortolke scenen og stille spørgsmål via stemme eller tekst, hvilket giver præcise og kontekstuelle svar med det samme.. Dette overvinder den største barriere for billedsøgning, hvor et enkelt foto ikke altid er tilstrækkeligt til at give fuld kontekst til forespørgslen.

Sådan bruger du video- og stemmesøgning i Google Lens trin for trin

  1. Åbn Google Lens-appen fra din Android- eller iOS-telefon eller fra forstørrelsesglasikonet i Googles søgefelt.
  2. Vælg "Søg med dit kamera". Ret kameraet mod det objekt, den scene eller den situation, du vil gennemgå.
  3. Tryk og hold optageknappen nede for at optage en kort video (normalt op til 20 sekunder). Under optagelsen kan du tilføje et spørgsmål højt om det, du ser. Alternativt kan du skrive spørgsmålet efter at have optaget videoen.
  4. Når den er færdig, vil Googles kunstige intelligens analysere både videoen og lyden af ​​din forespørgsel, udvælge de mest relevante billeder og svare i løbet af få sekunder.

Under optagelsen viser systemet meddelelsen "Tal nu for at spørge om denne scene". Denne proces gør oplevelsen meget mere naturlig, da du kan indsnævre det, du vil vide, og afdække detaljer, som en enkelt billed- eller tekstsøgning ikke kunne identificere.

Hvilken slags svar opnås, og avancerede praktiske anvendelser

La Svarenes variation og præcision overstiger langt den klassiske billedsøgning., fordi AI har adgang til mere kontekst og kan korrelere visuelle og mundtlige detaljer i videoen. Nogle eksempler på anvendelser og bemærkelsesværdige praktiske tilfælde:

  • Identifikation af bevægelige genstande og dyrIdeel til optagelse af aktive kæledyr, dyr i deres naturlige miljø eller køretøjer i aktion og kontrol af arter, mærker eller karakteristika, der kan gå ubemærket hen i et statisk billede.
  • Anerkendelse af steder og monumenterOptag et panoramabillede af en plads eller bygning, og spørg om dens historie, arkitektur eller interessante fakta. AI kan spore anmeldelser, historiske oplysninger og nøgledata.
  • Indhentning af information om produkter i butikkerSer du noget interessant og vil du gerne vide prisen, meninger eller alternativer? Optag produktet og spørg højt. Systemet tilbyder købslinks, sammenligninger og andre brugeres erfaringer.
  • Videoforespørgsler fra tredjepartOptag din tv-, computer- eller tabletskærm for at identificere sange, skuespillere, steder, restauranter eller andre visuelle eller hørbare elementer i scenen.
  • Hjælp til uddannelse og problemløsningOptag et eksperiment, en matematisk operation eller betjeningen af ​​et defekt apparat, og bed om en løsning, forklaring eller trinvis vejledning.
  • Kunst og naturudforskning: : Konsulter om et kunstværk, en eksotisk plante, en geologisk formation, en skytype osv., og få detaljerede forklaringer og ressourcer til at udvide informationen.
  • Øjeblikkelig oversættelse på fartenFor rejsende giver det dig mulighed for at optage bevægelige skilte, etiketter eller undertekster og modtage oversættelser, uanset om skiltet er ude af fokus eller svært at fange på et billede.
  • Håndværk og gør-det-selv-projekterDu kan optage materialerne og processen, stille spørgsmål om det næste trin eller anmode om detaljerede instruktioner, der er skræddersyet til konteksten for din video.
  • KøkkenopskrifterViser ingredienser eller processen i en opskrift og spørger om tilberedning, tilberedningstider eller ingrediensalternativer.

Der er ingen grund til at skrive lange tekster eller spilde tid på tekniske beskrivelser.. Du skal blot optage, vise og stille spørgsmål for at få adgang til et præcist overblik, der er skræddersyet til din kontekst, takket være Googles multimodale AI.

Gemini og AI-oversigter: Den kunstige intelligens bag magien

Motoren, der muliggør denne funktion, er Gemini, Googles avancerede kunstige intelligensmodel, der er i stand til at forstå billeder, tekst, lyd og nu hele videoer.. Hvordan fungerer det? Når du optager en video og stiller et spørgsmål, analyserer Gemini optagelserne billede for billede, identificerer vigtige visuelle fragmenter og krydsrefererer disse oplysninger med dit spørgsmål, uanset om det er talt eller skrevet.

Resultatet viser sig i form af AI-oversigter, den eksperimentelle funktion, der behandler information tilgængelig på nettet, opsummerer den tydeligt og viser den på enhedens skærm på få sekunder. Dette gør søgningen virkelig multimodaltAI kombinerer billede, stemme og kontekst, hvilket muliggør løsning af spørgsmål, der tidligere krævede flere søgninger eller vanskeligt detaljerede beskrivelser.

For nogle brugere, især hvor funktionen stadig er eksperimentel, kan det være nødvendigt at aktivere indstillingen "Søgelaboratorier" og aktivere "AI-oversigter og mere" fra Google-appen. Mens udrulningen er begyndt i engelsktalende regioner, skrider udvidelsen til andre sprog og lande hurtigt frem.

Eksempler og demonstrationer fra det virkelige liv: Sådan reagerer Google Lens på video og stemme

Det praktiske potentiale er blevet set i tests optaget af eksperter som Mishaal Rahman, der dokumenterede genkendelsen af ​​smartwatches, tallerkener med mad eller byscener på få sekunder. For eksempel, da man optog en skål med blåbær og spurgte, hvor mange der var, returnerede Gemini det nøjagtige antal i realtid. I en anden test, ved at optage et smartwatch og spørge om dets model og operativsystem, identificerede AI'en korrekt de fleste detaljer, selvom den specifikke model kunne variere en smule.

I yderligere eksperimenter har det været muligt at identificere fuglearter i flugt, identificere køretøjer i bevægelse, tælle objekter i en scene og tilbyde komplekse pædagogiske forklaringer. Nøjagtigheden afhænger af videoens kvalitet og skarphed, men svarenes hastighed og anvendelighed overstiger langt stillbilledsøgningernes.

Person med en klemme med google linse
Relateret artikel:
Alt du kan opnå med Google Lens: Komplet og opdateret guide

Integration med Googles økosystem og nye søgemetoder

Udviklingen af ​​Google Lens forbedrer ikke kun hovedappen, men driver også nye funktioner på tværs af Googles økosystem.. Nogle af de mest bemærkelsesværdige integrationer og fordele inkluderer:

  • Direkte søgning på YouTubeIdentificer elementer i videoer i appen, f.eks. steder, sange, skuespillere eller produkter, blot ved at optage din skærm.
  • Beriget Chrome-oplevelseGiver dig mulighed for at vælge video-, billed- eller tekstfragmenter fra websider og se oplysninger uden at forlade browseren.
  • Oversættelse i bevægelseBrug kamera- og videofunktionen til at oversætte bevægelige skilte eller undertekster under rejser eller skiftende situationer.
  • Smart købVed at registrere produkter får du direkte links til butikker, prissammenligninger, anmeldelser og tilgængelighed i realtid, hvilket optimerer online- og offlineshopping.

Begrænsninger, brugskrav og privatliv

Funktionen Det er stadig i progressiv implementering, så dens tilgængelighed afhænger af regionen, sproget og om eksperimentet "AI-oversigter" er aktiveret på din konto. I nogle tilfælde skal brugeren tilmelde sig Search Labs og aktivere tilhørende eksperimenter fra Google-appen ved at trykke på det kolbeformede ikon.

  • Maksimal videolængdeVideo er typisk begrænset til 10-20 sekunder for at sikre effektiviteten af ​​AI-analyse.
  • Anbefalet kvalitetDet anbefales at optage i godt lys og fokusere korrekt på motivet, da nøjagtigheden af ​​responsen afhænger af skarpheden, indramningen og klarheden i omgivelserne.
  • BeskyttelseSom standard undgår AI ansigtsgenkendelse og fokuserer analysen på objekter, handlinger og kontekster, ikke personer. Det er dog tilrådeligt at undgå at registrere personoplysninger eller personer uden samtykke.
  • Upræcise svarI forvirrende, uklare eller hurtige videoer kan AI tilbyde omtrentlige svar eller forslag i stedet for præcise løsninger. Alligevel er nytteværdien i de fleste tilfælde meget høj.

Takket være visuel videosøgning i Google Lens åbner der sig en horisont af muligheder, der forandrer den måde, vi løser spørgsmål, lærer, sammenligner, shopper og udforsker verden på. Denne AI-drevne funktion leverer information skræddersyet til hver enkelt situation ved at kombinere stemme, billede, video og kontekst i ét trin, hvilket bringer brugerne tættere på fremtiden for intelligent søgning. Hold øje med udviklingen af ​​Google Lens, og tøv ikke med at drage fordel af denne forbedring, som udvisker linjerne mellem den fysiske og digitale virkelighed i din håndflade.