Результаты поиска по запросу "data-mining"

1 ответ

По большей части эти два вектора указывают в одном направлении (большие координаты будут доминировать над меньшими различиями в другой координате). Ожидается косинусное сходство ~ 1 (Помните, что cos (0) = 1)

ользую формулу косинусного сходства, чтобы рассчитать сходство между двумя векторами. Я пробовал два разных вектора, как это:Vector1 (-1237373741, 27, 1, 1, ...

2 ответа

найти все два словосочетания, которые появляются в нескольких строках в наборе данных

Мы хотели бы запустить запрос, который возвращает две словосочетания, которые появляются в более чем одной строке. Так, например, возьмите строку «Данные ниндзя». Поскольку он присутствует в нескольких строках нашего набора данных, запрос должен ...

1 ответ

Если вы начали, вы должны иметь финский, потому что есть другие, которые могут понадобиться.

ТОП публикаций

2 ответа

Используйте больше данных ...

аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...

1 ответ

Я думал, что принял это. Но я обнаружил, что просто нажал кнопку upvote. Прости за это.

меня естьматрица сходства пользователя и пользователя, что некоторые строки имеют повторяющиеся значения иNaN userId 316 320 359 370 910 userId 316 1.0 0.500000 0.500000 0.500000 NaN 320 0.5 1.000000 0.242837 0.019035 0.031737 359 0.5 0.242837 ...

21 ответ

На самом деле все наоборот. Классификация обычно контролируется, а кластеризация обычно не контролируется.

кто-нибудь объяснить, в чем разница между классификацией и кластеризацией в интеллектуальном анализе данных? Если можете, приведите примеры того и другого, чтобы понять основную идею.

1 ответ

Конечно, это не удаляет избыточные функции.

аюсь создать свой собственный и простой алгоритм выбора функций. Набор данных, с которым я собираюсь работать,Вот [http://www.cs.cornell.edu/people/pabo/movie-review-data/review_polarity.tar.gz] (очень известный набор данных). Может кто-нибудь ...

0 ответов

@JRB Хорошо, я предлагаю вам сначала попробовать это самостоятельно, и если у вас возникли проблемы с его работой, опубликуйте это как вопрос и то, что вы пытались сделать, и мы постараемся вам помочь.

ал, что HTMLAgility 1.4 - отличное решение для очистки веб-страницы. Будучи новым программистом, я надеюсь, что смогу внести свой вклад в этот проект. Я делаю это как форму заявки c #. Страница, с которой я работаю, довольно прямолинейна. ...

1 ответ

извлечение отношений из текста

Я хочу извлечь отношения из неструктурированного текста в виде (SUBJECT, OBJECT, ACTION) отношений, например, «Мальчик сидит на столе и ест курицу» дал бы мне, (Мальчик, курица, есть) (Мальчик, стол, МЕСТОПОЛОЖЕНИЕ) и т.д.. хотя программа ...

4 ответа

Кластеризация траекторий: какой метод кластеризации?

Как новичок в машинном обучении, у меня есть набор траекторий, которые могут быть различной длины. Я хочу объединить их, потому что некоторые из нихна самом деле тот же путьи они простоSEEM разныеиз-за шума. К тому же,невсе они изодинаковые ...