Я хотел бы написать приложение, которое ищет данные Google Ngram, чтобы возвращать слова и фразы, которые раньше были более популярными, произвольным процентом, в течение какого-то произвольного диапазона лет, чем сейчас.Как искать Google Ngrams для «датированных» слов и фраз?
В идеале, я хотел бы быть в состоянии найти эти слова и фразы без указания их фронт. Может ли кто-нибудь помочь мне придумать способ сделать это, используя загруженную копию данных Ngrams?
@ duncan-malashock, если это звучит правильно, я придумаю пример SQL-запроса, чтобы закончить это вычисление. Тем не менее, я хочу убедиться, что это совпадает с тем, что вы пытаетесь найти. – tlehman
Эй, я использую mapreduce для выполнения этой задачи, можете ли вы, пожалуйста, направить меня в этом отношении? –
@MuneebulHassan Не здесь, но есть хорошие учебные пособия для этого: http://hadooptutorial.info/mapreduce-use-case-for-n-gram-statistics/ – tlehman