Previous Entry Share Next Entry
2016-01

про макулатуру

Самый длинный договор, который я лично подписывал, содержал 50 с чем-то страниц legalese мелким шрифтом.

Но он таки меркнет и становится бледной тенью, если посмотреть, какое количество макулатуры регламентирует деятельность банков, бирж, трейдеров и прочих участников рынка в США.

То есть, хм, сами тексты вполне себе структурированы и читабельны. Но вот их количество...
У меня пока что эстимэйт в миллионы страниц, но может быть там и больше...

Короче, очень занятная задача для information retrieval и natural language processing, да :)

This entry was originally posted at http://wizzard.dreamwidth.org/484130.html. It has comment count unavailable comments. Please comment there using OpenID.

  • 1
justy_tylor June 12th, 20:26
Насколько я помню, подобные сервисы для лоеров заявлялись одной из ниш для IBM Watson. Об интеграциях не слышал.

Сама задача интересна, но способствует продлению жизни этого нечитаемого говна, так что если за те же деньги, то лучше что-то полезное.

  • 1
?

Log in

No account? Create an account