Я ищу новые идеи для двух функций, которые я реализую.Сегментация и коллокации
1.) Текст сегментация особенность:
Ex:
User Query: Resolved Query:
----------- ---------------
It has lotsofwordstogether It has lots of words together
I am using normal recursion or DP solution using unigrams probability.
2.) Вид словосочетании:
Ex:
User Query: Resolved Query:
---------- ---------------
I like t shirts in Wal mart I like t-shirts in Walmart
Нет понятия, как сделать, чтобы это. Только идея, которую я имею в настоящее время, символизирует предложение и объединяет не значащие токены с предыдущими токенами или другими токенами для формирования слов, которые можно проверить против униграмм.
Эти решения медленны для моих требований (особенно первого). Я хочу использовать эти функции вместе. Ищите лучшие идеи.
Я новичок в этом поле. Можете ли вы указать какую-то книгу или онлайн-источник на это. Как можно разрешить футболку с помощью n-граммы? – starkk92