Какие предметы, темы нужно выучить выпускнику информатики, чтобы применить доступные рамки машинного обучения, особенно SVMs

Я хочу научить себя достаточно машинному обучению, чтобы я мог, для начала, понять достаточно, чтобы использоватьимеется в наличии ML-фреймворки с открытым исходным кодом, которые позволят мне делать такие вещи, как:

Просмотрите HTML-страницы страниц с определенного сайта и «поймите», какие разделы образуют контент, какие рекламные объявления, а какие - метаданные (ни контент, ни реклама - например, TOC, биография автора и т. Д.)

Просмотрите исходный HTML-код страниц из разрозненных сайтов и «классифицируйте», принадлежит ли сайт определенной категории или нет (список категорий будет предоставлен заранее) 1.

... похожие задачи классификации по тексту и страницам.

Как видите, мои непосредственные требования связаны с классификациейнесопоставимые источники данных а такжебольшой объемы данных.

Что касается моего ограниченного понимания, то использование нейросетевого подхода потребует больше обучения и поддержки, чем использование SVM?

Я понимаю, что SVM хорошо подходят для (бинарных) задач классификации, таких как моя, и фреймворки с открытым исходным кодом, такие как libSVM, достаточно развиты?

В таком случае, какие предметы и темы нужно изучать выпускнику информатики прямо сейчас, чтобы можно было решить вышеперечисленные требования и использовать эти рамки?

Я хотел бы держаться подальше от Java, возможно, и у меня нет языковых предпочтений иначе. Я готов учиться и приложить столько усилий, сколько смогу.

Мое намерение не в том, чтобы писать код с нуля, а, во-первых, в использовании различных фреймворков, доступных для использования (я не знаю достаточно, чтобы решить, какие именно), иЯ должен быть в состоянии исправить вещи, если они идут не так, как надо.

Ваши рекомендации по изучению определенных частей статистики и теории вероятностей не являются чем-то неожиданным с моей стороны, так что говорите, если требуется!

Я буду изменять этот вопрос при необходимости, в зависимости от всех ваших предложений и отзывов.

Ответы на вопрос(4)

Ваш ответ на вопрос