Программные методы обработки и анализа информации:
predictive coding
Термин "predictive coding" используется в разных смыслах. В своем буквальном значении он определяет
совокупность программных продуктов, используемых для обработки и анализа исходной информации с целью предсказания
(прогнозирования) результатов действия проанализированных обстоятельств.
В правосудной деятельности британских судов за ним закрепилось другое значение. Это обозначение
реализуемого специальным программным продуктом процесса исследования значительных массивов
информации с целью выстраивания рейтинга релевантности (относимости к поставленной проблеме)
найденных отдельных слов, выражений или более крупных единиц текста. Иными словами, predictive coding
это обзор, анализ и построение списка буквальных и смысловых совпадений информации с некоторыми заранее определенными
(можно сказать, ключевыми) сведениями, задача обнаружения которых поставлена перед программой.
Фактически, программы, реализующие predictive coding это программы-поисковки, но только
более специальные, более производительные и, главное, более предметно ориентированные в отличие от всем хорошо
известных поисковых машин интернета.
Общим названием всех программных продуктов, реализующих функцию специального поиска информации
в электронных документах по степени буквального или смыслового совпадения, является аббревиатура
TAR (technology-assisted review - программные ассистенты поиска или обзора).
Документы, отобранные программой по степени релевантности поставленной задаче, выстраиваются в список.
Последующее изучение информации из включенных в список документов осуществляется "вручную".
Программы TAR способны к треннингу. Последовательное уточнение задачи в ходе проведения программой тестовых
выборок документов, приводит к лучшим результатам. Поиск все более конкретизируется, количество отысканных сведений
уменьшается, и они становятся все более и более релевантными.
В 2013 году инвестиционная компания Pyrrho Investment Ltd.
(Pyrrho Investment Ltd. v MWB Property Ltd and Ors [2016] EWHC 256 (Ch)
обвинила нескольких менеджеров компании MWB Business Exchange Ltd.,
в которой имела существенный акционерный интерес, в причинении крупного имущественного ущерба управляемой ими компании.
Вследствие принятых менеджерами решений и путем совершения различных сделок компания MWB лишилась существенной части
своих активов.
В своем исковом заявлении компания Pyrrho указала, что сделки были инициированы менеджментом
в нарушение фидуциарных обязанностей действовать разумно и добросовестно, исключительно в интересах управляемой компании и ее
акционеров. Некоторые сделки содержали также признаки сделок с заинтересованностью менеджмента в их совершении,
о чем менеджеры предпочли умолчать, хотя были обязаны раскрыть эту информацию.
В подобного рода делах сбор судом доказательств, как правило, требует реализации процедуры раскрытия истцами и
ответчиками суду, а также друг другу всей информации о своей деятельности в пределах определенного срока и в связи
с рассматриваемым спором. Процедура раскрытия информации в интересах правосудия именуется disclosure,
иногда discovery, но этот последний термин больше характерен для обозначения процедуры раскрытия
информации в США.
Одним из направлений поиска истины в деле Pyrrho являлось изучение электронной переписки обвиненных в
совершении неблаговидных поступков менеджеров. Переписка хранилась на почтовом сервере управляемой
ими компании. Изучить требовалось содержание писем, начиная с 2009 года, т.е. за 7 лет.
Всего в архиве насчитывалось 17,6 миллиона файлов, из которых нужно было выбрать файлы, содержащие информацию, относящуюся к
предмету спора. После расчистки этого массива информации от дублирующих друг друга
файлов и прочего
электронного мусора количество файлов, с информацией в которых требовалось ознакомиться, составило 3,1 миллиона единиц.
Ручная
обработка такого количества файлов потребовала бы найма значительного количества временного персонала, постановку перед ними
ряда конкретных задач по поиску интересующих суд сведений, в общем, очень серьезных затрат денег, времени и трудовых
ресурсов. Было очевидно, что такие затраты на проведение ручных манипуляций с файлами электронной почты могут оказаться
сопоставимыми с размером ущерба, который, по мнению истца, менеджеры причинили управляемой ими компании.
Новизна проблемы определялась тем, что судебной практике Великобритании
не были известны никакие иные, кроме ручных, методы поиска интересующих суд обстоятельств в связи с процедурой раскрытия
информации. Эти методы осуществлялись истцами, ответчиками и нанятыми ими юридическими фирмами и должны были иметь
своим результатом предоставление суду документов, содержащих интересующую суд информацию.
Сам факт необходимости поиска имеющих доказательственное значение сведений в электронных документах никакой новинкой не
был. Сегодня в подавляющем количестве случаев рассмотрения судом споров в сфере предпринимательских и корпоративных отношений
им изучаются свидетельства, имеющие своим источником именно электронные файлы. Но пока еще никакие специальные
программно-аппаратные средства и методы для поиска информации не использовались.
Суд особо отметил в своем решение это обстоятельство. Правила гражданского судопроизводства очень подробно отвечают на
вопросы "Где искать?" и "Зачем искать?", но не содержат ответа на
вопрос "Как искать?", подразумевая именно ручную обработку документов. Суд также подчеркнул, что упоминаемая правилами
судопроизводства возможность использования при изучении электронных документов метода поиска по ключевым словам далеко
не всегда приводит к положительным результатам. Правонарушители в своей электронной корреспонденции стараются быть
осторожными и, как правило, используют различные иносказания и намеки, которые смысловой поиск определить может, но
поиск по ключевым словам выявить не в состоянии.
Использование истцом специального программного обеспечения для сбора доказательств противоправной деятельности ответчиков
требовало одобрения суда. В противном случае у ответчика возникал бы сильный аргумент о применении недопустимых методов
сбора доказательств.
Размышляя над проблемой дозволения использования специальных программ поиска и анализа относящейся к предмету спора
информации, суд принял во внимание американскую судебную практику. В США уже решили в положительном смысле аналогичный
вопрос о применении программных продуктов при изучении крупных массивов электронных документов с целью сбора доказательств.
Даже в соседней Ирландии уже однажды в суде озвучивалась подобная проблема и также была решена в пользу компьютера.
В конечном итоге, суд принял решение о том, что опыт зарубежных юрисдикций демонстрирует полезность и допустимость
призвания в помощь при раскрытии информации программных методов изучения электронных документов. Нет сведений, что эти
методы менее аккуратны по сравнению с ручным поиском, равно как в правилах гражданского судопроизводства не существует
прямых запретов на их использование. С учетом объема подлежащих исследованию электронных документов (свыше 3 миллионов),
расходы на их ручную обработку могут составить несколько миллионов фунтов, что не соответствует экономическим интересам
ни истца, ни ответчиков.
Решение суда вызвало достаточно оживленное обсуждение в юридическом мире Великобритании, в первую очередь, благодаря
своему возможному влиянию на снижение размера судебных расходов сторон при рассмотрении крупных корпоративных или
предпринимательских споров. Это решение снова напомнило всем британским юристам о том, что современные экономические
реалии требуют от них более тщательного отношения к тому, что именуется "cost management" - управлению
судебными расходами.
Можно посадить за изучение миллионов электронных файлов сто сотрудников юридической практики, при необходимости
нанять студентов, и в течение нескольких месяцев до рези в глазах просматривать один электронный документ за другим.
После этого выставить счет клиенту на несколько миллионов фунтов. Но можно запросить одобрение суда на
использование специальной программы, которая проделает всю ту же самую работу за несколько часов, ну, может быть, дней.
Стоить она будет несколько десятков тысяч фунтов или даже меньше. Счет клиенту в результате сократиться в десятки раз.
Провокационный для любой юридической практики вопрос - что лучше?
Первый вариант поведения - это та действительность, в которой до последнего времени строили свое взаимоотношения
юридические фирмы и их клиенты. Не удивительно, что последних не очень устраивала величина выставляемых им счетов за
оказанные юридические услуги. Второй вариант - это реальное в интересах клиента управление юридической фирмой своими
расходами на ведение дел, требующих раскрытия информации из многочисленных электронных файлов.
Решение суда по делу Pyrrho потому и вызвало повышенный интерес со стороны практикующих юристов, что отныне
процедуры ручного исследования значительных массивов электронной документации не могут считаться правильным
подходом к принципу управления собственными расходами юридических практик. Клиенты, которым не будет предложен
вариант использования специального программного обеспечения для снижения расходов на оплату услуг юристов с целью
исполнения судебных приказов о раскрытии информации, требующей непомерно высоких затрат ручного труда, просто перестанут
сотрудничать с такими юристами.
Позиция суда о допустимости и желательности использования predictive coding в процедурах раскрытия информации
получила свое развитие почти немедленно. Если в деле Pyrrho имелось согласие обеих сторон на использование
специальной программы, то в рассмотренном тем же Высоким судом Англии и Уэльса (The High Court of England and Wales)
спустя несколько месяцев деле
Brown v BCA Trading [2016] EWHC 1464 (Ch) стороны не смогли
достичь согласия об использовании аналогичной программы и суду, исходя из интересов правосудия и экономических интересов
сторон, пришлось своим решением потребовать использования программы с целью изучения значительно количества электронных
документов.
|