?

Log in

No account? Create an account
Previous Entry Share Next Entry
2016-01

про макулатуру

Самый длинный договор, который я лично подписывал, содержал 50 с чем-то страниц legalese мелким шрифтом.

Но он таки меркнет и становится бледной тенью, если посмотреть, какое количество макулатуры регламентирует деятельность банков, бирж, трейдеров и прочих участников рынка в США.

То есть, хм, сами тексты вполне себе структурированы и читабельны. Но вот их количество...
У меня пока что эстимэйт в миллионы страниц, но может быть там и больше...

Короче, очень занятная задача для information retrieval и natural language processing, да :)

This entry was originally posted at http://wizzard.dreamwidth.org/484130.html. It has comment count unavailable comments. Please comment there using OpenID.

  • 1
zhengxi June 12th, 2017
information retrieval и natural language processing юридических текстов - жирная тема, фирмы с тысячами (или даже десятками тысяч?) сотрудников (то есть "чуть поменьше гугла") только этим занимаются.
но они не хипстерские и не на слуху, я вот даже названий вспомнить не могу.

Edited at 2017-06-12 08:19 pm (UTC)

  • 1