извлечение фраз из текстового файла в java [закрыто]
я делаю проект по обнаружению вторжений на основе хоста с использованием набора данных ADFA-LD, сейчас я делаю модуль извлечения функций. я построил словарь фраз, который состоит из фраз системных вызовов длины 4. А теперь для извлечения функций мне нужно сравнить фразы с новыми трассировками системных вызовов (ниже приведены некоторые примеры):
sys_clock_gettime sys_poll sys_poll sys_clock_gettime sys_poll sys_poll sys_poll sys_clock_gettime sys_poll sys_clock_gettime sys_poll sys_poll sys_poll sys_poll sys_poll sys_pollys
Что мне нужно, как я могу сравнить эти фразы с новыми следами. Я делаю в Яве.
словарь моей фразы:
sys_socketcall-sys_poll-sys_clock_gettime-sys_poll
sys_clock_gettime-sys_poll-sys_poll-sys_socketcall
sys_poll-sys_socketcall-sys_poll-sys_clock_gettime
sys_poll-sys_clock_gettime-sys_clock_gettime-sys_clock_gettime
sys_clock_gettime-sys_clock_gettime-sys_socketcall-sys_clock_gettime
sys_socketcall-sys_clock_gettime-sys_poll-sys_poll
sys_poll-sys_poll
Я использую «-» в качестве разделителя при сравнении этих фраз с новыми трассами, поэтому я присоединился к уникальным системным вызовам с «-».