Google abriu a API para OCR
Serviços Web / / December 24, 2019
Sim, eles trabalham no Google Livros certamente trará bons resultados, podemos começar a colher. E agora eu vou te dizer como.
Os documentos digitalizados não requerem sempre uma transformação no próprio texto. Mas às vezes ela quer não ganhar qualquer acordo novo, e uma cópia eletrônica de algo e não. Claro, você pode usar algum programa barato o OCR, indo com o scanner, ou até mesmo comprá-lo (não roubar você) FineReader. Mas o software OCR de desktop livre é executado também porque agora os textos estão cada vez mais sendo fotografado, não digitalizada.
Para baixar todas as imagens (JPEG, PNG, GIF) com reconhecimento de texto para posterior API Google e abriu no Google Docs. Agora você pode fazer upload de imagens para uma biblioteca de documentos, eo servidor Google irá transformá-lo em texto.
Há também um exemplo de aplicação que ilustra como a API:
Mas você, os programadores devem pensar em criar a sua própria interface para esses recursos. Por exemplo - você tem os scans de livros em PNG? Esta é uma perversão, não é? Portanto, você tem o cartão na mão - escrever um aplicativo que carrega a página de texto por página, não viola os limites e se conecta toda a carga em um único texto.
Mas lembre-se, existem limitações na API, e o principal deles, parece-me - algo que é reconhecido apenas Latina tão logo. Também é preciso ter cuidado com a altura de caracteres não é inferior a 10 pixels, eo tamanho total da imagem não exceda 10 megapixels.