A Google 34 nyelvű OCR támogatást nyújt

A Google már régóta jelen van az O ptical Oracle ( OCR ) üzletágban, és ma már frissítették ezt a funkciót 29 új nyelv támogatására. 2009 szeptemberében a Google megszerezte az reCAPTCHA-t, és azóta egyszerre küzdöttek a levélszemét ellen, miközben javítják a fordításokat az emberek által beírt szavakkal. A frissítés, amit ma látunk, az a munka gyümölcse, amelyet a technológia.

Mi az OCR?

Ha csak csatlakozol hozzánk, az optikai karakterfelismerés egy olyan automatizált rendszer, amely a szövegképet kódolt, választható szövegekké alakítja. A Google OCR-t használ a képek és PDF fájlok beolvasásához, majd átvizsgálja a szerkeszthető Google Doc formátumot. Az elmúlt 2 évben a Google a reCAPTCHA rejtvényekből származó emberi inputokat használta, hogy növeljék sikerüket összetett szavak azonosításában.

Milyen nyelveket adtak hozzá?

A további nyelvek mellett a Google az OCR minőségét is javította az 5 korábban végrehajtott nyelv esetében: angol, olasz, német, spanyol és francia nyelven. A hozzáadott 29 új nyelv a következő:

Bolgár
2. Katalán
3. kínai (egyszerűsített Han)
4. Horvát
5. Cseh
6. dán
7. holland
8. filippínó
9. finn
10. görög
11. Magyar
12. Indonéz
13. Japán
14. koreai
15. Lettország

    Litván
    17. norvég
    18. Lengyel
    19. portugál
    20. román
    21. orosz
    22. Szerb
    23. Szlovák
    24. szlovén
    Svéd
    26. Thai
    27. török
    28. Ukrán
    29. vietnami

    Ha képeket vagy PDF-fájlokat tölt fel a Google Dokumentumokba, győződjön meg róla, hogy a fájlban lévő szöveg nyelvét adja meg! Ehhez tegye a fájlt a sorba, hogy feltöltse, majd jelölje be a Szöveg konvertálása PDF- vagy képfájlokból a Google Dokumentumok dokumentumaihoz jelölőnégyzetet. Megjelenik a Dokumentum nyelve legördülő menü, ahol kiválaszthatja a nyelvét.

    Kipróbálta a Google OCR technológiáját a régi családi folyóiratok, könyvek, vagy bármi mást, amit a ház körül helyeztek el? Kipróbálhatja azt iPhone vagy Android telefonján is, ha rendelkezik a Google Goggles alkalmazással!