Где я могу найти текстовый список или библиотеку, которая содержит список распространенных продуктов? [закрыто]

Я пишу скрипт на Python, который анализирует электронные письма, который включает в себя поиск в тексте электронного письма любых слов, которые являются общими продуктами питания. Мне нужен какой-то способ определить, являются ли слова действительно продуктами питания.

Я рассмотрел несколько API обработки естественного языка (таких как AlchemyAPI и NLTK 2.0), и у них, похоже, есть извлечение именованных сущностей (что я и хочу), но я не могу найти тип сущности для продуктов питания в частности.

Вполне возможно, что обработка естественного языка излишня для того, что мне нужно - я просто хочу список продуктов, которые я могу сопоставить. Где я могу найти такой список слов? Нужно ли мне писать свой собственный скребок, чтобы разобрать его из какого-либо онлайн-источника, или есть более простой способ?

Ответы на вопрос(3)

Ваш ответ на вопрос