Гарвард оцифровал 6,4 миллиона судебных дел для обучения ИИ
«Закон»
Фото: sarbc.ru
0 116

Гарвард оцифровал 6,4 миллиона судебных дел для обучения ИИ

Для того, чтобы научить нейросеть распознавать пневмонию, понадобилось более миллиона рентгеновских снимков грудной клетки.

Библиотека Школы права Гарвардского университета завершила проект Caselaw Access Project — сбор открытых данных о судебных делах, проходивших на территории США, сообщает MIT Technology Review. Процесс заключался в сканировании более 40 миллионов страниц документов начиная с XVII века: всего в базу данных попали примерно 6,4 миллиона судебных дел. Эти данные помогут эффективнее обучать компьютерные алгоритмы, которые могут быть использованы в юриспруденции. 

Современный анализ данных позволяет применять методы машинного обучения практически к любым сферам. Разумеется, для эффективного его использования нужно очень большое количество данных. К примеру, для того, чтобы научить нейросеть распознавать пневмонию, понадобилось более миллиона рентгеновских снимков грудной клетки. 

Что касается задач, включающих обработку естественного языка, то здесь данных для эффективной работы должно быть использовано еще больше. В особенности, когда дело касается принятия важных решений. Разработка алгоритмов, которые могли бы принимать решения и облегчать процесс в суде, — одна из таких задач.

Облегчить ее выполнение решили исследователи из Школы права Гарвардского университета, которые в течение нескольких лет сканировали и анализировали открытые материалы, принадлежащие библиотеке университета. Материалы включали в себя судебные заключения и стенографии: в них содержатся полные доступные материалы по каждому судебному делу. Первые документы датируются 1658 годом, а последние — 2018. Всего для создания базы данных исследователи оцифровали около 40 миллионов страниц, а общее количество дел превышает 6,4 миллиона.

Пригодиться база данных может не только разработчикам, но и юристам. Для получения доступа к ней необходимо зарегистрироваться на сайте проекта

Читать далее

Последние новости
Организаторы Конгресса: Российская академия наук; Российская академия ракетных и артиллерийских наук; Сообщество ученых…
Ученые Института нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН моделируют процессы…
Глава SpaceX Илон Маск заявил, что ракетный двигатель Raptor достиг показателя 268,9 бар…