awesome-llm-projects

awesome-llm-papers | awesome-llm-datasets

🤖 Unser Ziel ist es, eine umfassende Sammlung von Projekten zu erstellen und zu pflegen, die die bemerkenswerte Vielseitigkeit und das Potenzial von LLM-Anwendungen demonstrieren.

Projektindex:

🦄LLMs
🏆 Benchmarks Leaderboard
💬ChatBot
🗣️Voice
🎵Music
🌄Image
🧸3D Model
🎥Video
🕸️Search Engine
👩🏽‍💻Develop Assistant
🧠AI Agent
🤼Multi-Agent Collaboration
💻Terminal
📰Web Sites
🗜️Hardware
⌨️Prompt Engineering
🤯LLMs Inference And Serving
📋Others

Projekte

‼️Achtung: Wenn der Projektname mit * beginnt, bedeutet dies, dass das Projekt weder Open Source ist noch Anwendungen veröffentlicht hat.

🦄 LLMs

Command-R: Command-R ist ein skalierbares generatives Modell, das auf RAG und Tool Use abzielt, um KI im Produktionsmaßstab für Unternehmen zu ermöglichen.
Grok-1: Grok-1 ist ein 314 Milliarden Parameter Mixture-of-Experts Modell, das von xAI von Grund auf neu trainiert wurde.
Mistral: Mistral AI veröffentlicht Open Source LLMs, darunter Mistral 7B, Mistral 8x7B und Codestral.
DBRX: DBRX ist ein offenes, allgemeines LLM, das von Databricks erstellt wurde.
mPLUG-DocOwl: Modularisiertes Multimodales Großes Sprachmodell für die Dokumentenverständnis.
OpenChat: Fortschrittliche Open-Source-Sprachmodelle mit unvollständigen Daten
WizardLM: Stärkung großer vortrainierter Sprachmodelle zur Befolgung komplexer Anweisungen
CodeGemma-7b: Eine offizielle Google-Veröffentlichung für Code-LLMs.
Awesome-Chinese-LLM: Enthält viele Open-Source-Chinesische LLMs.
llama3: Meta neu veröffentlichte LLMs.
Snowflake Arctic: Arctic ist eine dichte-MoE-Hybrid-Transformator-Architektur, die von Grund auf vom Snowflake AI Research Team vortrainiert wurde. Durchschnittlich werden Codierung (HumanEval+ und MBPP+), SQL-Generierung (Spider) und Anweisungsbefolgung (IFEval) verwendet.
DeepSeek-V2-Chat: Ein starkes, wirtschaftliches und effizientes Mixture-of-Experts Sprachmodell
Qwen 1.8B,7B,14B,72B: Chat- und vortrainiertes großes Sprachmodell, vorgeschlagen von Alibaba Cloud.
Granite Code Models 3b,8b,20b,34b: Granite Code Models, IBMs Open-Source-Code-Modelle: Eine Familie von Open Foundation Models für Code Intelligence
Hunyuan-DiT: Ein leistungsstarker Multi-Resolution-Diffusion-Transformator mit feinkörnigem chinesischem Verständnis
MiniCPM-V 2.0: Ein effizientes Endseitiges MLLM mit starken OCR- und Verständnisfähigkeiten
Stable Audio Open 1.0: Stable Audio Open 1.0 generiert variabel lange (bis zu 47s) Stereo-Audio mit 44,1 kHz aus Text-Prompts.
Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, und Qwen2-72B: Qwen2 ist die große Sprachmodellserie, die vom Qwen-Team, Alibaba Cloud, entwickelt wurde.
GLM-4-9B: GLM-4-Serie: Offene mehrsprachige multimodale Chat-LMs
AutoCoder: Ein neues Modell, das für die Code-Generierungsaufgabe entwickelt wurde. Seine Testgenauigkeit auf dem HumanEval-Basisdatensatz übertrifft die von GPT-4 Turbo (April 2024) und GPT-4o.
Nemotron 4 340B: Die offenen Modelle von Nvidia für die Generierung synthetischer Daten (SDG). Enthält Basis-, Anweisungs- und Belohnungsmodelle.
Fish Speech V1.2: Fish Speech V1.2 ist ein führendes Text-to-Speech (TTS) Modell, das auf 300.000 Stunden englischer, chinesischer und japanischer Audiodaten trainiert wurde.
Phi-3 Familie: Phi-3 Familie kleiner Sprach- und multimodaler Modelle. Sprachmodelle sind in kurzen und langen Kontextlängen verfügbar.
Gemma 2: Gemma 2 bietet erstklassige Leistung, läuft mit unglaublicher Geschwindigkeit auf verschiedenen Hardware und lässt sich leicht in andere AI-Tools integrieren.

🏆 Benchmarks Leaderboard

open_llm_leaderboard: Dies ist die zentrale Organisation (HuggingFace), die das Open LLM Leaderboard pflegt.
LMSys Chatbot Arena Leaderboard: Eine crowdsourced, randomisierte Battle-Plattform. Verwenden Sie Benutzerstimmen, um Elo-Bewertungen zu berechnen.
META Leaderboard: Massive Text Embedding Benchmark (MTEB) Leaderboard.
LLM-Perf Leaderboard: Ziel ist es, die Leistung (Latenz, Durchsatz und Speicher) von LLMs mit verschiedenen Hardware, Backends und Optimierungen unter Verwendung von Optimum-Benchmark und Optimum-Flavors zu benchmarken.
Big Code Models Leaderboard: Vergleichen Sie die Leistung von Basis-Mehrsprachigen Code-Generierungsmodellen auf dem HumanEval-Benchmark und MultiPL-E.
Open ASR Leaderboard: Rangieren und bewerten Sie Spracherkennungsmodelle auf dem Hugging Face Hub.
Toolbench Leaderboard: Eine Bewertung der LLM-Tool-Manipulationsfähigkeiten.
OpenCompass 2.0 LLM Leaderboard: Bietet umfassende, objektive und neutrale Bewertungen und Rankings für erstklassige große Sprachmodelle und multimodale Modelle.
Open Ko-LLM Leaderboard: Bewertet die Leistung des koreanischen großen Sprachmodells (LLM).

💬 ChatBot

ChatGPT: ChatGPT ist ein kostenlos nutzbares AI-System. Verwenden Sie es für ansprechende Gespräche, gewinnen Sie Einblicke, automatisieren Sie Aufgaben und erleben Sie die Zukunft der AI, alles an einem Ort.
Gemini: Bard ist jetzt Gemini. Holen Sie sich Hilfe beim Schreiben, Planen, Lernen und mehr von Google AI.
character.ai: Wo intelligente Agenten leben!
Claude: Sprechen Sie mit Claude, einem AI-Assistenten von Anthropic.
Mistral AI: Mistral macht fortschrittliche AI allgegenwärtig und bietet maßgeschneiderte AI für alle Entwickler.

🗣️ Voice

Einschließlich Text zu Sprache, Sprache zu Text, Sprache zu Sprache, Sprachgenerierung:

*Vall-E: Ein neuronales Codec-Sprachmodell für die Sprachsynthese.
ElevenLabs: AI Voice Generator & Text to Speech
Whisper: Robuste Spracherkennung durch großflächige schwache Überwachung
Krisp: Krisp unterdrückt Hintergrundgeräusche und reduziert Echo während Ihrer Anrufe.
Voicemod: Voicemod ist ein kostenloser Echtzeit-Stimmenverzerrer und Soundboard, verfügbar sowohl auf Windows als auch auf macOS.
*NaturalSpeech 3: Zero-Shot-Sprachsynthese mit faktorisierter Codec- und Diffusionsmodellen.
VoiceCraft: VoiceCraft ist Zero-Shot-Sprachediting und Text-to-Speech in freier Wildbahn.
Parler-TTS: Parler-TTS ist ein leichtgewichtiges Text-to-Speech (TTS) Modell, das hochwertige, natürlich klingende Sprache im Stil eines gegebenen Sprechers (Geschlecht, Tonhöhe, Sprechstil usw.) erzeugen kann.
Sounds: Sounds für Kreative, Spieleentwickler, Künstler, Videomacher. Erleben Sie den besten AI Sound FX Generator
VIVA: VIVA ist die AI-gestützte kreative visuelle Designplattform
ChatTTS: ChatTTS ist ein generatives Sprachmodell für den täglichen Dialog.
StreamSpeech: StreamSpeech ist ein nahtloses "All in One" Modell für Offline- und gleichzeitige Spracherkennung, Sprachübersetzung und Sprachsynthese.
Dream Machine: Dream Machine ist ein AI-Modell, das schnell hochwertige, realistische Videos aus Text und Bildern erstellt.
CosyVoice: Mehrsprachiges großes Sprachgenerierungsmodell, das Inferenz-, Trainings- und Bereitstellungs-Full-Stack-Fähigkeiten bietet.

🎵 Music

Suno: Suno ist ein innovatives Tool zur Musikproduktion, das künstliche Intelligenz nutzt, um Texteingaben in Originalsongs zu verwandeln
Udio: Machen Sie Ihre Musik. Entdecken, erstellen und teilen Sie Musik mit der Welt.
Haimian Music: Ein von ByteDance entwickeltes AI-generiertes Musikprodukt, das sowohl in Chinesisch als auch in Englisch eine überlegene Gesangsqualität bietet.
Jamboss: Jamboss ist eine super einfache AI-Musikgenerator-App, mit der Sie Ihre Ideen und Texte in erstaunliche vollständige Songs verwandeln können.

🌄 Image

Einschließlich Text zu Bild, Bild zu Bild und Animation:

DALL-E: Erstellen von Bildern aus Text.
Stable Diffusion: Stable Diffusion ist ein Deep-Learning-Text-zu-Bild-Modell.
Midjourney: Midjourney ist ein generatives künstliches Intelligenzprogramm und -dienst, das Bilder aus natürlichen Sprachbeschreibungen erstellt, ähnlich wie andere AI-Technologien wie OpenAIs DALL-E und Stability AIs Stable Diffusion.
StickerBaker: StickerBaker ist ein Open-Source-Tool, das es Benutzern ermöglicht, Aufkleber mit AI-Technologie zu erstellen.
*PIXART-Σ: Schwach-zu-Stark-Training des Diffusionstransformators für 4K-Text-zu-Bild-Generierung.
ResAdapter: ResAdapter ist ein Plug-and-Play-Resolution-Adapter, der Diffusionsmodelle beliebiger Stil-Domänen ermöglicht, auflösungsfreie Bilder zu erzeugen: keine zusätzliche Schulung, keine zusätzliche Inferenz und kein Stiltransfer.
FaceChain: FaceChain ist eine Deep-Learning-Toolchain zur Erstellung Ihres digitalen Zwillings.
APISR: Anime Production Inspired Real-World Anime Super-Resolution (CVPR 2024)
OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models: OMG ist ein Framework für die Mehrkonzept-Bilderzeugung
BasicPBC: Lernen von Inklusionsabgleich für die Animation Paint Bucket Colorization.
DesignEdit: Mehrschichtige latente Dekomposition und Fusion für einheitliche und präzise Bildbearbeitung.
VAR: eine neue visuelle Generierungsmethode, die GPT-Style-Modelle über Diffusion hinaushebt und Skalierungsgesetze beobachtet.
Ideogram: Ideogram ist ein kostenloses AI-Tool, das realistische Bilder, Poster, Logos und mehr generiert.
MagicClothing: Fokus auf kontrollierbare kleidungsgetriebene Bildsynthese.
*IntrinsicAnything: Lernen von Diffusionsprioren für die inverse Wiedergabe unter unbekannter Beleuchtung.
HeyBeauty: Entdecken Sie Schönheit mit AI, machen Sie Mode neu definiert.
IC-Light: IC-Light ist ein Projekt zur Manipulation der Beleuchtung von Bildern.
Logo Diffusion: Erstellen Sie Logos in Sekunden mit generativer A.I.
MistoLine: Ein vielseitiges und robustes SDXL-ControlNet-Modell für anpassbare Line-Art-Konditionierung
InstaDrag: Blitzschnelle und präzise Drag-basierte Bildbearbeitung, die aus Videos hervorgeht
Omost: Omost ist ein Projekt zur Umwandlung der Codierungsfähigkeit von LLM in die Fähigkeit zur Bildgenerierung (oder genauer gesagt zur Bildkomposition).
ToonCrafter: ToonCrafter kann zwei Cartoon-Bilder interpolieren, indem es die vortrainierten Bild-zu-Video-Diffusionsprioren nutzt.
Hallo: Hierarchische Audio-gestützte visuelle Synthese für die Animation von Porträtbildern
UniAnimate: Zähmung einheitlicher Videodiffusionsmodelle für konsistente menschliche Bildanimation.
Krea: Erstellen und verbessern Sie Bilder und Videos mit leistungsstarker AI kostenlos.
Leonardo AI: Leonardo AI ist ein generatives AI-Tool, mit dem Sie erstklassige visuelle Assets für Ihre Projekte erstellen können.
MimicBrush: Zero-Shot-Bildbearbeitung mit Referenzimitation
SketchDeco: Dekorieren von Schwarz-Weiß-Skizzen mit Farbe.
Tensor.Art: AI-Modell-Sharing-Plattform, Online-Modelle ausführen, um Bilder zu generieren und Modelle kostenlos zu trainieren.
AutoStudio: AutoStudio: Erstellen konsistenter Subjekte in der interaktiven Bildgenerierung mit mehreren Runden
LivePortrait: Effiziente Porträtanimation mit Stitching- und Retargeting-Steuerung
IMAGDressing: Interaktive modulare Bekleidungsgenerierung für virtuelles Ankleiden
PaintsUndo: Ein Basismodell von Zeichenverhalten in digitalen Gemälden

🧸 3D Model

Einschließlich Text zu 3D-Modell:

TripoSR: TripoSR ist ein schnelles und vorwärtsgerichtetes 3D-Generierungsmodell, das in Zusammenarbeit zwischen Stability AI und Tripo AI entwickelt wurde.
PantoMatrix: PantoMatrix: Generierung von sprechenden Gesichts- und Körperanimationen
Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians.
*Make-It-Vivid: Ankleiden Ihrer animierbaren zweibeinigen Cartoon-Charaktere aus Text.
*CAT3D: CAT3D: Erstellen Sie alles in 3D mit Multi-View-Diffusionsmodellen
DiffTF: Großes Vokabular 3D-Diffusionsmodell mit Transformator
DreamMat: Hochwertige PBR-Materialgenerierung mit geometrie- und lichtbewussten Diffusionsmodellen
Unique3D: Hochwertige und effiziente 3D-Mesh-Generierung aus einem einzigen Bild.
Era3D: Hochauflösende Multiview-Diffusion mit effizienter zeilenweiser Aufmerksamkeit.
*OccFusion: Rendering von verdeckten Menschen mit generativen Diffusionsprioren
AIUNI: AI generiert einzigartige Assets, Avatare, Animationen.
MeshFormer: Hochwertige Mesh-Generierung mit 3D-geführt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.de.md

README.de.md

awesome-llm-projects

awesome-llm-papers | awesome-llm-datasets

Projekte

🦄 LLMs

🏆 Benchmarks Leaderboard

💬 ChatBot

🗣️ Voice

🎵 Music

🌄 Image

🧸 3D Model

Files

README.de.md

Latest commit

History

README.de.md

File metadata and controls

awesome-llm-projects

awesome-llm-papers | awesome-llm-datasets

Projekte

🦄 LLMs

🏆 Benchmarks Leaderboard

💬 ChatBot

🗣️ Voice

🎵 Music

🌄 Image

🧸 3D Model