Reclasificación del virus de la PPA en 7 biotipos mediante aprendizaje automático no supervisado

Dinhobl M, Spinard E, Tesler N, Birtley H, Signore A, Ambagala A, Masembe C, Borca MV, Gladue DP. Reclassification of ASFV into 7 Biotypes Using Unsupervised Machine Learning. Viruses. 2024; 16(1): 67. https://doi.org/10.3390/v16010067

08-oct-2024 (hace 1 meses 7 días)

En 2007 se declaró en Georgia un brote de peste porcina africana (PPA), enfermedad mortal de cerdos domésticos y jabalíes causada por el virus de la peste porcina africana (vPPA), que desde entonces se ha propagado por todo el mundo. Históricamente, el vPPA se clasificaba en 25 genotipos diferentes. Sin embargo, un nuevo sistema propuesto recategorizó todas las cepas del virus en 6 genotipos utilizando exclusivamente las secuencias proteicas de p72 predichas. No obstante, el genoma del vPPA es muy extenso y codifica entre 150 y 200 genes, por lo que las clasificaciones basadas en un único gen son insuficientes y engañosas, ya que las cepas que codifican un p72 idéntico a menudo presentan mutaciones significativas en otras áreas del genoma.

Métodos: En este estudio se presenta una nueva clasificación del vPPA basada en comparaciones realizadas considerando todo el proteoma codificado. Se analizó la similitud entre secuencias proteicas homólogas de una base de datos seleccionada compuesta por las secuencias proteicas predichas para ser codificadas por 220 genomas reanotados del vPPA. Se aplicaron ponderaciones a las matrices de identidad de proteínas y se promediaron para generar una matriz de identidad genoma-genoma que luego fue analizada por un algoritmo de aprendizaje automático no supervisado, DBSCAN, para separar los genomas en grupos distintos.

Conclusión: Se concluye que todos los genomas del virus de la PPA disponibles pueden clasificarse en 7 biotipos distintos.