2010-08-05 1 views
4

веб-приложение под названием StatSheet получило финансирование сегодня (4 августа 2010) -Автоматизированной журналистика

http://techcrunch.com/2010/08/04/former-crunchies-finalist-statsheet-recieves-1-3-million-in-series-a/

Они делают «автоматизированную журналистику» - с использованием компьютеров для создания отчетов человека выглядящего спортивных игр от статистики

http://www.guardian.co.uk/media/pda/2010/mar/30/digital-media-algorithms-reporting-journalism

кто-нибудь есть понимание того, что подход/алгоритмы используются, чтобы сделать это/как это может быть воспроизведен?

ответ

7

Детали для проектов, как это немного скудны, но это выглядит как бейсбол сводных Stats Monkey состоит из:

  1. Статистическая модель: Они строят модель того, как игры в бейсбол, как правило, разворачиваются, большинство вероятно, путем изучения того, как определенные переменные (например, пробеги, у летучих мышей и т. д.) изменяются в ходе игры или отличаются от того, что вы ожидаете увидеть в игре (например, команда без имени больше набирает обороты, чем высокопоставленная команда). Насколько хорошо данная игра подходит (или не подходит), эта модель дает им представление о том, что может быть интересно в этой игре (например, ключевые игры или игроки).

  2. поколения Текст: Учитывая библиотеку предварительно написанных повествовательных дуг (например, игра обратно и вперед, поступления из-за победы, и т.д.), они используют «интересную информацию» от модели игра, чтобы построить резюме игры. Я не уверен, но похоже, что они используют дерево решений - обусловленное информацией из модели - для выбора одной из этих дуг.

  3. Разного клей: Это не упоминается в их рецензии, но я бы себе представить, что есть изрядное количество жестких кодировки правил, «склеивать» основные сюжетные дуги в единую, сплоченную историю ,

Авторы статистики Обезьяна провела много исследований в смежных областях, таких как обобщение сайта и автоматическое объединение и генерация контента. Вот несколько статей, которые могут быть интересны: