Uniform Manifold Approximation and Projection (UMAP)

Vue d'ensemble

La Uniform Manifold Approximation and Projection (UMAP) (approximation et projection uniforme de variétés) est une technique de réduction des dimensions qui, comme t-SNE, peut être employée pour faire des visualisations, mais aussi pour faire des réductions non linéaires générales.

Les chercheurs de l’Institut Tutte ont élaboré une théorie mathématique et la mise en œuvre efficace d’un logiciel. On l’utilise déjà dans plusieurs domaines, notamment la biologie unicellulaire, la science des matériaux, la physique de la matière condensée et l’apprentissage machine.

L’algorithme est lui même fondé sur trois hypothèses au sujet des données :

  1. les données sont distribuées uniformément dans la variété riemannienne;
  2. la métrique riemannienne demeure constante, ou du moins, c’est le postulat émis;
  3. la variété est localement connexe

En suivant ces hypothèses, il est possible de représenter la variété à l’aide d’une structure topologique floue. On détermine l’intégration en cherchant une projection en basse dimension des données dont la structure topologique se rapproche le plus de la structure topologique floue.

Les bases mathématiques solides assurent que l’algorithme est robuste et interprétable. Elles sont aussi appliquées à des problèmes plus complexes en apprentissage non supervisé.

Essayez-le!

La version la plus récente du logiciel est disponible sur le compte GitHub de Leland McInnes (Ph. D.). Des documents sont également disponibles en ligne, de même qu’un prétirage décrivant les fondements mathématiques sous-jacents.

Pour plus de renseignements, veuillez communiquer avec l’Institut Tutte.