Eliminar filas duplicadas de una matriz o marco de datos
Quiero comprobar qué filas de la matriz o del marco de datos están duplicadas, ¿cómo podemos encontrarlo?
Queremos eliminar filas duplicadas. Las filas duplicadas son filas que tienen los mismos valores en ambas columnas 1 y 2 al ignorar su orden.
Por ejemplo, para la siguiente matriz:
Col1 Col2 database
A B IntAct
A B Bind
B A BioGrid
Quiero tener solo una de las filas.
Col1 Col2 database
A B IntAct