Как я читал о tf–idf на Wiki, я был смущен тем, что это означает под словом «документ». Означает ли это пункт?Что означает «документ» в контексте НЛП?
«Частота обратного документа является мерой того, сколько информации предоставляет слово, то есть, является ли этот термин распространенным или редким во всех документах. Это логарифмически масштабированная обратная доля документов, содержащих слово, полученное путем деления общего количества документов на количество документов, содержащих этот термин, а затем с помощью логарифма этого частного ».