Úvod > Články > Alternativní vyhledávání obrázků

Alternativní vyhledávání obrázků

Najít na internetu obrázek není nic snadného, zvláště pokud máte poměrně konkrétní představu o tom, jak by měl vypadat. V článku se podíváme na to, jak efektivně a rychle nalézt ten správný obrázek za pomocí nástrojů MUFIN, Google či TinEye.

Vyhledávání nejrůznějších informací na internetu je důležitou součástí každodenní práce i zábavy téměř každého uživatele. Vyhledávání textových informací je poměrně snadné, neboť hledáme text zadáním textu. Vyhledávač pak pomocí různých algoritmů dokáže vrátit lepší či horší výsledky. Výrazně obtížnější je vyhledávání netextových informací – videí, obrázků, hudby. Pomocí textového dotazu chce získat informaci, která je často spíše subjektivní – když zadáte do vyhledávače „pěkná fotografie Brna“, máte jen malou šanci na úspěch. 

Běžně jsme v netextovém vyhledávání odkázáni na nějaká pomocná data. Pokud hledáte video na YouTube, pak napřed projde vyhledávač názvy klipů, pak diskuse a popisky a na základě těchto informací vrátí relevantní výsledky. Jak ale prohledávat například obrázky, které nikdo nijak neoznačil? 

Při hledání obrázků je možné využít tři „klasické“ cesty. Předně je to vyhledávání pomocí názvu obrázku a jeho HTML popisku (parametr alt u tagu <img>). Problémem je, že tento popisek má i jiný význam než metadatický pro vyhledávací stroje. Využívají ho například nevidomí uživatelé, lidé s nekorektně nastaveným prohlížečem, uživatelé textových browserů a mnozí další. Nepočítaje to, že ho tvůrci webu mohou úmyslně použít k SEO volbou nekorektních (či nepřesných) slov. Přesto se jedná asi o nejjednodušší způsob vyhledávání obrázků a asi jeden z nejčastějších. 

Druhou variantou je mít někde přesné popisky obrázků. To lze použít většinou pouze lokálně, například ve fotobankách. Ty mají ke každému snímku seznam klíčových slov a často i větný popis. Nechybí ani zařazení do kategorií. Třetí možností, vhodnou jen pro určité speciální případy, je vyhledávání na základě EXIF informací ze snímků. To je užitečné například tehdy, pokud hledáte záběry pořízené z určitého místa - a nejlépe v určitém čase. Zde moderní fotoaparáty v EXIF popiscích přinášejí mnohé zajímavé informace. Jedním z velkých problémů je ale to, že EXIF není ISO normou a každý výrobce jej ukládá jinak a vkládá do něj jiné informace. To je pro on-line vyhledávání nepříjemné, ale překonatelné. 

Mezi nástroje, které je možné použít k tomuto „klasickému“ vyhledávání, patří například Google Images, Yahoo! Image Search, Bing a mnohé další. Co ale dělat, když nejste s nalezenými obrázky úplně spokojeni? Nebo potřebujete něco trošičku jiného než právě nalezený obrázek? Možná vám pomůže jeden ze tří zde představených experimentálních vyhledávačů obrázků. Většinou se jedná o výzkumné, vývojové či jinak testovací verze, takže nečekejte žádné velké zázraky. Pomoci však mohou a jejich potenciál je poměrně velký. 

Google Similar Images

Google Similar Images představuje zajímavý produkt - prozatím umístěný v Labs. Umožňuje prohledávat obrázky umístěné na internetu běžnou metodou pomocí popisků a názvu. Ve vráceném výsledku je pod každým obrázkem zvláštní odkaz s názvem „Similar Images“, který vyhledá podobné obrázky k právě vybrané fotografii. Tento nástroj je vhodný především tehdy, pokud potřebujete nalézt obrázek velmi podobný – například popsaný v jiném jazyce, identické schéma bez popisku, … Osobně postrádám možnost filtrování podle licence, což „ostrá“ verze vyhledávače obrázků od Google umí. 

Pokud hledáte nějaké frekventované téma, pak jsou výsledky již poměrně dobré. Výhodou je velký vzorek prohledávaných snímků a také rychlost celého prostředí. Pokud se vyhledávání podobných obrázků vylepší a zpřesní, mohl by být tento alternativní počin integrován do běžného prohledávání obrázků. Zatím ale trpí poměrně velkou nepřesností a především v méně frekventovaných tématech vrací výsledky zcela nesmyslné. Před projektem je tak zatím poměrně velký kus cesty. 

MUFIN

Projekt pochází z Fakulty informatiky Masarykovy university v Brně a nese název MUFIN (Multi-Feature Indexing Network). V budoucnu by se neměl zaměřovat pouze na vyhledávání obrázků, ale také například videa. 

Vyhledávání je založeno na distribuovaných výpočtech. které porovnávají především metrickou podobnost dvou objektů, dále pak barvu a případné další parametry. Prozatím jsou prohledávány pouze snímky (100 miliónů) ze serveru Flickr. Nevýhodou je tedy zatím omezený zdroj grafických dat. Vyhledávání je naopak poměrně přesné. Základní výběr zajistí zadání klíčových slov a pak již jen zjemňujete požadavek pomocí hledání podobných obrázků. Pokud máte štěstí na zaindexovanou grafiku, pak se jedná o jeden z nejlepších vyhledávačů svého druhu a rozhodně stojí za vyzkoušení. 

TinEye

Třetí a zřejmě nejvíce alternativní vyhledávač nese název TinEye a od dvou předchozích se poněkud liší. Neprohledává grafiku primárně podle textu, ale čistě na základě vizuální podobnosti. Jako vzor nefungují klíčová slova jako doposud, ale přímo obrázek. Je tedy nutné mít nějakou předlohu u sebe, nebo si ji vyhledat. Je možné použít obrázek z počítače i url adresu. Výsledkem je pak sada podobných snímků. Pokud hledáte tedy nějaké informace na základě grafické předlohy, pak pro vás může být tento vyhledávač velice zajímavým nástrojem. Také umožní nalézt případné neoprávněné využití vaší grafiky. 

Závěrem

Je vidět, že se pokrokům a změnám nevyhýbá ani vyhledávání netextových souborů. Zdaleka jsme ani nezmínili všechny projekty, které se touto oblastí zabývají, ale spíše jsme se pokusili o určité panoráma touto zajímavou oblastí, která v posledních letech zažívá poměrně velký rozvoj. 

Jako jedno z dalších možných alternativních využití těchto prohlížečů se může jevit například vyhledávání osob v sociálních sítích. Máte fotografii a hledáte profil. Technicky upravit MUFIN či TinEey na to, aby byly schopny porovnávat specializovaně právě obličeje, není příliš obtížné. Nástroje, které na fotografii oblast obličeje označí a specifikují, existují také. Již dnes je možné nechat si vyhledat kamarády, se kterými jste na fotce. Ač tyto nástroje mohou pomoci při získávání dat k „rozumným účelům“, snižují míru naší anonymity. Neříci někomu jméno tak nemusí znamenat, že si jej nedokáže zjistit během několika vteřin na Facebook či někde jinde, že nebude znát naše kamarády a přátele, se kterými se čas od času vyfotíme... Také na to je potřeba pamatovat ve chvíli, kdy se hovoří o sociálních sítích a alternativních vyhledávačích obrázků.

6. 10. 2009

Autor:

Témata

multimedia

Sdílejte

Přečtěte si také

 

Zápas Paul vs Tyson si na Netflixu naladilo 60 milionů domácností

Boxerský zápas mezi Jakem Paulem a Mikem Tysonem sledovalo na Netflixu 60 milionů domácností. Podle platformy šlo o...

 

YouTube plánuje přidat nové úrovně předplatného Premium

YouTube zveřejnil své plány na přidání dalších tarifů v rámci předplatného Premium. Spekuluje se o levnější úrovni...

 

Nova Sport 1 dnes odvysílá odvetu AC Sparta Praha - Shamrock Rovers

Fotbalisté Sparty se dnes chystají na odvetu proti irským Shamrock Rovers. Zápas můžete sledovat od 19:00 na stanici...

Nejčtenější články

Rusko udělilo Googlu pokutu, na zaplacení by mu nestačily ani všechny peníze světa

 

Ruský soud uložil společnosti Google pokutu dva a půl sextilionů rublů – dvojka následovaná 36 nulami – za omezování...

Vánoce u T-Mobile: Sluchátka a telefon za 1 Kč i data za půlku

 

T-Mobile si letos pro své zákazníky přichystal celou řadu vánočních dárků. Od tradičních telefonů a sluchátek za 1...

Nova ukončila spolupráci s Vodafonem a T-Mobilem, stahuje Voyo z TV balíčků

 

Skupina Nova se rozhodla, že omezí spolupráci s operátory Vodafone a T-Mobile. Platforma Voyo už od února nebude...