Seleccionar filas donde una columna tiene una cadena como 'hsa ..' (coincidencia de cadena parcial)

Tengo un archivo de texto de 371 MB que contiene datos de micro ARN. Esencialmente, me gustaría seleccionar solo aquellas filas que tienen información sobre microRNA humano.

He leído en el archivo usando un read.table. Por lo general, lograría lo que quisiera con sqldf: si tuviera una sintaxis "me gusta" (seleccione * de <> donde miRNA como "hsa"). Desafortunadamente - sqldf no soporta esa sintaxis.

¿Cómo puedo hacer esto en R? He mirado alrededor de stackoverflow y no veo un ejemplo de¿Cómo puedo hacer una coincidencia de cadena parcial. Incluso instalé el paquete stringr, pero no tiene lo que necesito.

Lo que me gustaría hacer es algo como esto, donde todas las filas donde hsa-* se seleccionan

selectedRows <- conservedData[, conservedData$miRNA %like% "hsa-"]

Lo que por supuesto, no es la sintaxis correcta.

¿Puede alguien ayudarme con esto? Muchas gracias por leer.

Asda

Respuestas a la pregunta(3)

Su respuesta a la pregunta