Это очень легко реализовать и использовать, у вас есть формула в статье, но в двух словах, вектор предложения просто V = sum_i ^ k = 1 Posweight (w_i) * IDFWeight (w_i) * V_i

ага что я пытаюсь реализовать, это говорит,В этой работе твиты были смоделированы с использованием трех типов текстового представления. Первая - это модель пакета слов, взвешенная по tf-idf (термин частота - обратная частота документа) (раздел 2.1.1). Второе представляет предложение путем усреднения вложений слов всех слов (в предложении), а третье представляет предложение путем усреднения взвешенных вложений слов всех слов, вес слова задается с помощью tf-idf (раздел 2.1.2). ).

Я не уверен насчет

третье представление который упоминается как взвешенное вложение слов, использующее вес слова, задается tf-idf. Я даже не уверен, могут ли они использоваться вместе.Усреднение (возможно, взвешенное) вложений слов имеет смысл, хотя в зависимости от основного алгоритма и обучающих данных это предложение может быть не лучшим. Интуиция следующая:

Ответы на вопрос(1)

Ваш ответ на вопрос