A Google 34 nyelvű OCR támogatást nyújt
A Google már régóta jelen van az O ptical Oracle ( OCR ) üzletágban, és ma már frissítették ezt a funkciót 29 új nyelv támogatására. 2009 szeptemberében a Google megszerezte az reCAPTCHA-t, és azóta egyszerre küzdöttek a levélszemét ellen, miközben javítják a fordításokat az emberek által beírt szavakkal. A frissítés, amit ma látunk, az a munka gyümölcse, amelyet a technológia.
Mi az OCR?
Ha csak csatlakozol hozzánk, az optikai karakterfelismerés egy olyan automatizált rendszer, amely a szövegképet kódolt, választható szövegekké alakítja. A Google OCR-t használ a képek és PDF fájlok beolvasásához, majd átvizsgálja a szerkeszthető Google Doc formátumot. Az elmúlt 2 évben a Google a reCAPTCHA rejtvényekből származó emberi inputokat használta, hogy növeljék sikerüket összetett szavak azonosításában.
Milyen nyelveket adtak hozzá?
A további nyelvek mellett a Google az OCR minőségét is javította az 5 korábban végrehajtott nyelv esetében: angol, olasz, német, spanyol és francia nyelven. A hozzáadott 29 új nyelv a következő:
Bolgár 2. Katalán 3. kínai (egyszerűsített Han) 4. Horvát 5. Cseh 6. dán 7. holland 8. filippínó 9. finn 10. görög 11. Magyar 12. Indonéz 13. Japán 14. koreai 15. Lettország | Litván 17. norvég 18. Lengyel 19. portugál 20. román 21. orosz 22. Szerb 23. Szlovák 24. szlovén Svéd 26. Thai 27. török 28. Ukrán 29. vietnami |
Ha képeket vagy PDF-fájlokat tölt fel a Google Dokumentumokba, győződjön meg róla, hogy a fájlban lévő szöveg nyelvét adja meg! Ehhez tegye a fájlt a sorba, hogy feltöltse, majd jelölje be a Szöveg konvertálása PDF- vagy képfájlokból a Google Dokumentumok dokumentumaihoz jelölőnégyzetet. Megjelenik a Dokumentum nyelve legördülő menü, ahol kiválaszthatja a nyelvét.
Kipróbálta a Google OCR technológiáját a régi családi folyóiratok, könyvek, vagy bármi mást, amit a ház körül helyeztek el? Kipróbálhatja azt iPhone vagy Android telefonján is, ha rendelkezik a Google Goggles alkalmazással!