A Google 34 nyelvű OCR támogatást nyújt

A Google már régóta jelen van az O ptical Oracle ( OCR ) üzletágban, és ma már frissítették ezt a funkciót 29 új nyelv támogatására. 2009 szeptemberében a Google megszerezte az reCAPTCHA-t, és azóta egyszerre küzdöttek a levélszemét ellen, miközben javítják a fordításokat az emberek által beírt szavakkal. A frissítés, amit ma látunk, az a munka gyümölcse, amelyet a technológia.

Mi az OCR?

Ha csak csatlakozol hozzánk, az optikai karakterfelismerés egy olyan automatizált rendszer, amely a szövegképet kódolt, választható szövegekké alakítja. A Google OCR-t használ a képek és PDF fájlok beolvasásához, majd átvizsgálja a szerkeszthető Google Doc formátumot. Az elmúlt 2 évben a Google a reCAPTCHA rejtvényekből származó emberi inputokat használta, hogy növeljék sikerüket összetett szavak azonosításában.

Milyen nyelveket adtak hozzá?

A további nyelvek mellett a Google az OCR minőségét is javította az 5 korábban végrehajtott nyelv esetében: angol, olasz, német, spanyol és francia nyelven. A hozzáadott 29 új nyelv a következő:

Bolgár
2. Katalán
3. kínai (egyszerűsített Han)
4. Horvát
5. Cseh
6. dán
7. holland
8. filippínó
9. finn
10. görög
11. Magyar
12. Indonéz
13. Japán
14. koreai
15. Lettország

Litván
17. norvég
18. Lengyel
19. portugál
20. román
21. orosz
22. Szerb
23. Szlovák
24. szlovén
Svéd
26. Thai
27. török
28. Ukrán
29. vietnami

Ha képeket vagy PDF-fájlokat tölt fel a Google Dokumentumokba, győződjön meg róla, hogy a fájlban lévő szöveg nyelvét adja meg! Ehhez tegye a fájlt a sorba, hogy feltöltse, majd jelölje be a Szöveg konvertálása PDF- vagy képfájlokból a Google Dokumentumok dokumentumaihoz jelölőnégyzetet. Megjelenik a Dokumentum nyelve legördülő menü, ahol kiválaszthatja a nyelvét.

Kipróbálta a Google OCR technológiáját a régi családi folyóiratok, könyvek, vagy bármi mást, amit a ház körül helyeztek el? Kipróbálhatja azt iPhone vagy Android telefonján is, ha rendelkezik a Google Goggles alkalmazással!