Tutoriel - Exécutez des modèles d'IA sur votre propre ordinateur

La confidentialité des données est un enjeu majeur. De nombreuses organisations, en particulier les établissements médicaux, accordent la plus haute priorité à la protection des données. Cela est d'autant plus vrai à l'ère de l'IA, où les services de chat IA populaires comme ChatGPT, Claude et autres utilisent les données que vous leur fournissez pour entraîner leurs modèles d'IA.

Les professionnels comme les médecins, les avocats et les consultants d'entreprise ont souvent besoin d'une assistance par IA mais ne peuvent pas se permettre de compromettre la confidentialité en téléchargeant des fichiers sensibles sur des plateformes cloud. Le traitement local par IA offre une solution essentielle, leur permettant d'analyser des documents et d'interagir avec l'IA en toute sécurité sur site, tout en préservant la confidentialité des données.

L'une des solutions d'IA locale est LM Studio. Vous pouvez télécharger ce logiciel sur votre ordinateur, et il servira d'assistant IA personnel, vous aidant à accomplir exactement ce que vous souhaitez, comme le ferait ChatGPT.

Ce tutoriel vous fournit les étapes précises pour installer et configurer LM Studio sur votre ordinateur (PC ou Mac) en toute simplicité.

À la fin de ce tutoriel, vous saurez comment :

Installer et configurer LM Studio
Télécharger et paramétrer les modèles d'IA
Interagir avec les modèles d'IA locaux
Dialoguer avec vos documents grâce à la génération augmentée par recherche (RAG)
Accéder aux outils avancés comme les sorties structurées et un serveur API local

Commençons sans plus attendre, voulez-vous ?

Pourquoi installer une IA sur mon ordinateur ?

Faire fonctionner une IA localement implique généralement de télécharger et d'exécuter un Large Language Model (LLM) directement sur votre Mac ou PC. En raison de leur taille importante, ces modèles nécessitent des ressources informatiques considérables pour fonctionner efficacement. Cependant, l'avantage majeur est d'avoir un contrôle total sur vos données. Nul besoin de transmettre vos informations à de grandes entreprises comme Google ou OpenAI, puisque tout reste en sécurité sur votre appareil.

Puisque tous les logiciels sont différents, les LLMs locaux varient en taille et en fonctionnalités. Les modèles compacts et efficaces sont compatibles avec le matériel grand public standard, ce qui les rend accessibles à de nombreux utilisateurs. En revanche, les modèles plus robustes et avancés nécessitent des GPUs puissants pour fonctionner de manière optimale.

Cette méthode présente plusieurs avantages majeurs :

Confidentialité améliorée : Toutes vos données et requêtes restent sur votre appareil, garantissant une confidentialité totale.
Accessibilité hors ligne : Les fonctionnalités d'IA sont disponibles sans connexion Internet, idéal pour le travail à distance ou les déplacements.
Personnalisation : Vous pouvez adapter les modèles locaux selon vos besoins spécifiques ou domaines d'expertise.

Dans ce guide, nous utiliserons LM Studio pour faire fonctionner des LLMs en local sur votre ordinateur. LM Studio se démarque des autres solutions d'IA locales grâce à son interface intuitive et ses fonctionnalités puissantes.

Si des alternatives comme Ollama sont davantage orientées vers les développeurs et généralement accessibles uniquement via des interfaces en ligne de commande, LM Studio offre une interface conversationnelle qui conjugue facilité d'utilisation et fonctionnalités sophistiquées. Cela le rend adapté aussi bien aux utilisateurs quotidiens qu'à ceux qui souhaitent un contrôle plus précis sur leurs modèles d'IA locaux.

Étape 1 - Installer et configurer LM Studio

Passons à la partie la plus intéressante. Rendez-vous sur le site web de LM Studio et téléchargez le logiciel. Que vous ayez un PC, un Mac ou Linux, LM Studio est compatible avec tous les principaux systèmes d'exploitation. Choisissez parmi les téléchargements disponibles. Nous utilisons un système Mac, donc nous allons vous montrer comment installer et configurer LM Studio sur Mac. La procédure est identique pour PC et Mac. Pas d'inquiétude si vous avez un PC, c'est exactement la même chose.

Après avoir téléchargé la version appropriée pour votre système d'exploitation, procédez à son installation.

‍

Lancez LM Studio que vous venez d'installer. Vous verrez apparaître une interface similaire à celle de ChatGPT. Examinons les principaux éléments avec lesquels nous allons travailler.

‍

‍Navigation latérale

La barre latérale à gauche permet d'accéder à la navigation principale :

Chat: Il s'agit de votre tableau de bord principal pour les conversations avec l'IA. Si vous avez déjà utilisé ChatGPT, vous reconnaîtrez instantanément cette fonctionnalité. Cet onglet affiche toutes vos conversations, récentes et anciennes. Il permet de créer de nouvelles discussions, d'accéder aux conversations existantes et d'interagir avec vos modèles d'IA chargés.
Developer: Cette fonctionnalité est destinée aux utilisateurs avancés. Cliquez ici pour accéder aux outils de développement et aux paramètres API. Cet onglet vous permet d'intégrer LM Studio, la documentation API, les outils de test et les configurations de points de terminaison dans vos applications.
My Models: Cette section fait office de bibliothèque personnelle pour tous les modèles que vous avez téléchargés. Vous pouvez examiner les détails de chaque modèle, gérer leur espace de stockage et voir quels modèles sont actuellement actifs. Elle affiche également la taille et le format de chaque modèle.
Discover: Parcourez des collections spécialement sélectionnées, recherchez des modèles spécifiques sur Hugging Face et accédez aux informations détaillées concernant les capacités de chaque modèle, l'espace de stockage requis et la compatibilité avec votre système.

L'interface a été conçue pour être intuitive. Elle offre des fonctionnalités robustes. Au fur et à mesure que vous utilisez LM Studio, ces caractéristiques s'harmonisent pour offrir une expérience fluide lors de l'exécution locale des modèles d'IA.

Commençons par explorer les fondamentaux. Au fur et à mesure que vous vous familiariserez avec cette plateforme fantastique, nous aborderons les fonctionnalités plus avancées.

Étape 2 - Télécharger et configurer les modèles d'IA

Une fois que vous maîtrisez bien l'interface, l'étape suivante consiste à télécharger un modèle depuis Hugging Face (une plateforme largement utilisée pour le partage de modèles d'apprentissage automatique) afin de l'exécuter localement sur votre machine. Pour la plupart des ordinateurs grand public standards, les modèles comportant entre 1 milliard et 13 milliards de paramètres sont idéaux.

Pour commencer à créer votre propre application de style ChatGPT, nous allons sélectionner le modèle Meta Llama 3.1 8B, qui est parfaitement adapté à la plupart des ordinateurs grand public. Si votre PC ou Mac dispose de spécifications plus modestes, envisagez de choisir des modèles plus légers comme le 3.2 3B. Il possède 3 milliards de paramètres pour garantir des performances fluides.

Voici la partie la plus intéressante. Rendez-vous dans la section "Discover" dans la barre latérale. Vous pourrez y explorer différents modèles d'IA présentés dans les "Staff picks" ou parcourir la collection complète en utilisant l'option "Search all". Les modèles sont listés dans l'onglet Discover ; vous pouvez sélectionner ceux que vous souhaitez télécharger. Le choix n'est pas très vaste. Si vous disposez d'1 To de stockage, téléchargez-les tous !

Procédons au téléchargement du modèle Llama 3.1 8B. Il suffit de saisir le nom du modèle dans la barre de recherche et de suivre les instructions pour lancer le téléchargement.

‍

‍

À savoir : Comme j'utilise un ordinateur Mac, j'ai choisi les modèles MLX pour garantir des performances optimales. Ils sont spécifiquement optimisés pour les processeurs Apple Silicon et offrent de meilleures performances pour les déploiements locaux. Si vous avez un PC, vous pouvez choisir parmi une large gamme de modèles. Utilisez les modèles GGUF pour les machines Windows.

Repérez le bouton de téléchargement situé à côté de la version que vous avez sélectionnée et cliquez dessus pour lancer le téléchargement. Le modèle occupera plusieurs gigaoctets d'espace, assurez-vous donc de disposer d'un espace de stockage suffisant et d'une connexion internet stable.

‍

‍

Une fois le téléchargement terminé, rendez-vous dans l'onglet "Chat" situé dans la barre latérale gauche pour accéder à l'interface de discussion. En haut de cet écran, vous trouverez un menu déroulant. Cliquez dessus pour afficher la liste des modèles disponibles. Repérez le modèle Llama que vous venez de télécharger et sélectionnez-le en cliquant sur son nom pour le charger dans l'environnement de discussion.

‍

‍

Important à savoir : Lors de conversations prolongées dans LM Studio, il est conseillé de régler votre longueur de contexte à environ 8k tokens pour mieux gérer les interactions plus longues. Cependant, procédez avec prudence, car ce paramètre peut considérablement augmenter l'utilisation de la mémoire et potentiellement déstabiliser l'application. De plus, il est recommandé de conserver les paramètres de GPU offload à leurs valeurs par défaut pour garantir des performances optimales.

Étape 3 - Interagir avec les modèles d'IA locaux

Maintenant que le modèle est chargé, commençons à poser des questions. L'interface de LM Studio est intuitive et facile à utiliser, rappelant celle des chatbots IA populaires comme Claude et ChatGPT.

Pour commencer, saisissez une question ou un message dans la zone de texte en bas. Vous pourriez par exemple essayer de demander :

Prompt:

Peux-tu m'expliquer ce qu'un modèle d'IA local peut faire pour répondre à des questions mathématiques complexes ?

Participez à la conversation de manière naturelle en posant des questions complémentaires ou en en introduisant de nouvelles au fil des échanges. L'IA prendra en compte l'ensemble de la discussion pour générer des réponses pertinentes.

Pour commencer une nouvelle conversation, cliquez sur le symbole "+" situé en haut de l'historique des conversations sur le côté gauche.

‍

Étape 4 - Discutez avec vos documents grâce au RAG

L'une des fonctionnalités phares de LM Studio est sa capacité à interagir avec des documents directement sur votre ordinateur, grâce à la génération augmentée par récupération (RAG). Cette approche est particulièrement avantageuse pour traiter des documents sensibles ou confidentiels puisque tout le traitement s'effectue localement, garantissant ainsi la confidentialité et la sécurité de vos fichiers.

Le RAG fonctionne en combinant les vastes connaissances de l'IA avec les informations spécifiques issues de vos documents. Lorsque vous posez une question, il analyse vos fichiers pour trouver le contenu pertinent et utilise à la fois les informations découvertes et ses connaissances intégrées pour fournir une réponse précise et personnalisée.

Pour utiliser RAG afin de dialoguer avec vos documents dans LM Studio, suivez ces étapes :

Localisez l'option "Upload File" dans la zone de discussion.
Vous pouvez télécharger jusqu'à cinq fichiers simultanément, avec une limite totale de 30 MB. LM Studio accepte les formats tels que PDF, DOCX, TXT et CSV.
Après avoir téléchargé vos fichiers, commencez à poser des questions sur leur contenu. L'IA analysera les documents pour extraire les informations pertinentes et les utiliser pour vous répondre efficacement.

Essayons de voir un exemple des capacités RAG en utilisant les documents de procédures opérationnelles standard :

Prompt:

Identifie et extrais toutes les sections de notre manuel de l'employé qui couvrent les exigences de suivi du temps de travail à distance. Puis, examine et compare ces sections avec les directives. Mets en évidence tous les aspects où notre politique actuelle pourrait nécessiter des mises à jour pour rester conforme.

‍Bon à savoir : Pour obtenir les meilleurs résultats avec RAG, essayez de poser des questions très spécifiques sur vos documents. Plus vous fournissez de détails, plus il sera facile pour le système d'extraire les informations les plus pertinentes et de vous donner une réponse claire et précise.

Étape 5 - Accéder aux outils avancés comme les sorties structurées et le serveur API local

Explorons quelques fonctionnalités avancées et paramètres clés pour ajuster le comportement de notre modèle :

Accédez aux paramètres avancés sur le côté droit de l'interface de chat dans la section 'Advanced configuration'. Cliquez sur l'icône 'lab' située dans le coin supérieur droit de l'interface de chat.

Temperature : Ajustez ce curseur pour contrôler le degré d'aléatoire dans les réponses de l'IA. Les valeurs basses (proches de 0) rendent les réponses plus ciblées et prévisibles, tandis que les valeurs élevées (proches de 1) permettent plus de variété et de créativité.
Top P et Top K : Ces paramètres influencent la façon dont l'IA choisit ses mots suivants. Leur ajustement permet d'équilibrer la cohérence des réponses tout en autorisant une certaine variation créative.
System Prompt : Ici, vous pouvez définir des instructions spéciales pour l'IA. Contrairement aux messages ordinaires, ces instructions guident l'IA tout au long de votre conversation, garantissant que les réponses restent conformes à vos directives.
Structured Output : Cette fonction formate les réponses de l'IA de manière claire et cohérente (généralement en JSON), ce qui peut être utile pour organiser les données. Nous en parlerons davantage dans la section "Advanced features".
Limit Response Length : Ce paramètre vous permet de contrôler la longueur des réponses de l'IA en définissant une limite de tokens, vous aidant à obtenir des réponses plus courtes ou plus détaillées selon vos préférences.

Dans ce guide, nous avons parcouru les étapes nécessaires pour configurer et utiliser des LLM locaux dans LM Studio, vous permettant d'exécuter des modèles d'IA sur votre ordinateur. Cette approche garantit la confidentialité de vos données et vous offre un contrôle total, depuis la configuration initiale jusqu'aux options avancées comme le RAG.

L'exécution de l'IA en local ouvre de nombreuses possibilités, particulièrement pour les applications privées, l'utilisation hors ligne et la personnalisation individuelle. À mesure que vous vous familiariserez avec LM Studio, n'hésitez pas à expérimenter différents modèles et paramètres pour trouver la configuration qui vous convient le mieux.