2013-02-19 1 views
4

У кого-нибудь есть ссылка для скачивания данных для обобщения текста, например, DUC 2007 или TREC? Пожалуйста, помогите мне.Ссылка на набор данных для суммирования текста?

+0

У меня такая же проблема, как у вас. вы нашли хороший набор данных? не могли бы вы поделиться с нами какой-либо ссылкой или т. д., пожалуйста? – Paniz

ответ

2

Вы можете использовать http://archive.ics.uci.edu/ml/datasets/Legal+Case+Reports для подхода к обобщению текста на основе извлечения. Он содержит catchPhrase, который может действовать как выбранное предложение для обучения. Но фраза может быть не столь подходящей.

1

Вы можете получить доступ к DUC набора данных после завершения какой-то организации и индивидуальные соглашения ..kindly см http://www-nlpir.nist.gov/projects/duc/data.html для получения дополнительной информации

0

Вы можете написать карта сайта искателю в Scrapy для

Это может дать вам около 1,45 млн. Рефератов и статей.

Также вы можете проверить этот набор данных harvardnlp sent summary и набор данных CNN Dailymail, который может дать рассказ некоторых статей.

Предупреждение. Поскольку все это разные источники, их способ письма может отличаться.