LJSear.ch - um serviço para aqueles que precisam os arquivos "Live Journal"
Serviços Web / / December 24, 2019
Você quer encontrar no registro de "aprender" um século de idade, mas não pode, porque as opções de pesquisa são limitados a um mês? Você vai libertar serviço LJSear.ch, Que contém os arquivos da-língua russa LiveJournal para o período de 2000-2015. Fale sobre isso seu criador Roman Ivanov (kukutz).
Ivanov Roman
Gerente de Produto na "Yandex". Lançou uma busca do blog, personalizado busca "Yandex", várias versões do "Yandex. Mail "serviços" Yandex. Lenta "" Ya.ru "" Yandex. Pictures "e vários outros. Ele agora está envolvida em "Yandex. Browser "e LJSear.ch.
O que é LJSear.ch?
"Saiba" Isto é mais do que arquivos terabyte. Indexados e disponível para pesquisa 340 milhões de posts e comentários 1 bilhão entre 2000 e o Outono de 2015. E tudo isso com o familiar para o blog ferramentas de busca: Limite por autor, por data, por parte da comunidade.
Novas entradas não são indexados, como nós consideramos o nosso projecto como um arquivo, memorial.
O projeto é totalmente sem fins lucrativos, sem publicidade, e outras maneiras de ganhar dinheiro não se destina.
Por que preciso de serviço?
No outono de 2015 a capacidade de busca de blogs "Yandex" foram limitados a apenas no mês passado. A explicação era simples: a grande maioria das pessoas estão procurando informaçãoAssociado com registros recentes e pesquisa profunda para eles é redundante.
É verdade. No mês passado é suficiente para tarefas como acompanhamento regular ou um comentário de busca vaidade de alguns acontecimentos recentes. Mas há um problema e pesquisa mais profunda.
Eu acredito que no "Saiba" aconteceu, ou pelo menos se refletiu quase toda a cultura de língua russa de zero anos. O valor deste arquivo não pode ser superestimada. Quando o "Yandex" tem pesquisa de arquivo fechado, estou muito desapontado, porque convencido de que esta recolha de informação deve ser retida para a humanidade. Bem e eu perguntei, arquivos "Yandex", e de repente ele concordou e deu-lhes.
Arquivo Blog bastante singular, porque muito não pode ser baixado no "Aprender". Muitas revistas são removidos pelos seus autores, alguns quebrado e destruído por hackers, em alguns casos, os registros não são excluídos, mas escondida a sete chaves.
Os últimos seis meses em que eu era responsável por garantir que os dados não são perdidos. Invoquei a ajuda de amigos, e entre eles havia aqueles que concordaram em ajudar a entender se podemos tornar as informações disponíveis para a pesquisa. Nós criamos um LJSear.ch serviço e, aparentemente, levou a um estado saudável.
Os voluntários eram muitos?
Foram encontrados. Um renomado especialista na área de UX Kohl Zayarny Eu vim com o design. Sasha Belyanskiy Peguei o BEM-vorstku e frontend em Node.js. Spaceinvaderz acoplado a administração sistémica. programação do servidor em PHP eu comecei na base da própria protótipo, o que fez o meu amigo Tobe.
O maior problema foi o ferro: quem vai pagar a hospedagem? Amigos certeza de que você pode ganhar dinheiro para sites kraudfandingovyh, mas eu era cético. E há pessoas maravilhosas veio até nós a partir de Servers.ru e se ofereceu para ajudar. Como resultado, temos um grande servidor dedicado com SSD para indexar e procurar backend além nuvem servidor virtual para o frontend.
Quem pode estar interessado no projeto?
À medida que novos registros não são indexados, o público, o que eu acho - são pesquisadores. Como literalmente pesquisadores camadas culturais do ano zero, e um atual ou ex-usuários "Learn", que querem encontrar algo que foi escrito nesses anos. E porque eu não limitar o máximo de Pesquisas tempo de execução: investigador pode esperar por consultas complexas e minutos, e dois. Claro, consultas simples são executadas rapidamente, e se o serviço detecta que a consulta é agora um lote, que inclui uma degradação controlada, incluindo os limites de timeout pedido.
LJSear.ch →