Diskussion zum Artikel "Integrieren Sie Ihr eigenes LLM in Ihren EA (Teil 3): Training Ihres eigenen LLM mit CPU"

 

Neuer Artikel Integrieren Sie Ihr eigenes LLM in Ihren EA (Teil 3): Training Ihres eigenen LLM mit CPU :

Angesichts der rasanten Entwicklung der künstlichen Intelligenz sind Sprachmodelle (language models, LLMs) heute ein wichtiger Bestandteil der künstlichen Intelligenz, sodass wir darüber nachdenken sollten, wie wir leistungsstarke LLMs in unseren algorithmischen Handel integrieren können. Für die meisten Menschen ist es schwierig, diese leistungsstarken Modelle auf ihre Bedürfnisse abzustimmen, sie lokal einzusetzen und sie dann auf den algorithmischen Handel anzuwenden. In dieser Artikelserie werden wir Schritt für Schritt vorgehen, um dieses Ziel zu erreichen.

Im vorigen Artikel dieser Serie haben wir die grundlegende Einrichtung der Umgebung für die Ausführung großer Sprachmodelle besprochen und eine einfache LLM-Instanz mit llama.cpp in WSL ausgeführt. Der spannendste Teil ist, dass Sie das Beispiel auch ohne einen leistungsstarken Grafikprozessor mit einer CPU ausführen können! In dieser Reihe von Tutorials werden die Hardware-Anforderungen so weit wie möglich gesenkt, um sicherzustellen, dass die Leser die Beispiele ausprobieren und verifizieren können, ohne durch Hardware-Probleme behindert zu werden. Natürlich werden wir in unserem Modelltrainingsteil auch Versionen für verschiedene Hardwareplattformen einführen, einschließlich einer reinen CPU-Version und einer Version, die AMD-Grafikkarten-beschleunigtes Rechnen unterstützt, in der Überzeugung, dass jeder in der Lage sein wird, es ohne Hardwarebeschränkungen zu versuchen.

Natürlich könnten Sie sich das fragen: Können mit einer CPU trainierte Modelle nützlich sein? Was ist die Bedeutung solcher Modelle? Wenn Sie ein Modell mit komplexen Funktionen trainieren oder komplexe Aufgaben mit Hilfe einer CPU lösen wollen, ist das zwar recht schwierig, aber es ist dennoch möglich, einige spezifische und relativ einfache Funktionen damit zu implementieren. 


In diesem Artikel wird beschrieben, wie man ein großes Sprachmodell mit einer CPU trainiert und einen Finanzdatensatz erstellt, der für das Training großer Sprachmodelle erforderlich ist. Dabei kann es sich um Kenntnisse handeln, die in meinen anderen Artikeln erwähnt wurden und die ich hier nicht wiederholen werde. Wenn Sie tiefer einsteigen möchten, lesen Sie bitte meine verwandten Artikel, in denen Sie die entsprechenden Links finden.

Autor: Yuqiang Pan