🤖 Unser Ziel ist es, eine umfassende Sammlung von Projekten zu erstellen und zu pflegen, die die bemerkenswerte Vielseitigkeit und das Potenzial von LLM-Anwendungen demonstrieren.
- 🦄LLMs
- 🏆 Benchmarks Leaderboard
- 💬ChatBot
- 🗣️Voice
- 🎵Music
- 🌄Image
- 🧸3D Model
- 🎥Video
- 🕸️Search Engine
- 👩🏽💻Develop Assistant
- 🧠AI Agent
- 🤼Multi-Agent Collaboration
- 💻Terminal
- 📰Web Sites
- 🗜️Hardware
- ⌨️Prompt Engineering
- 🤯LLMs Inference And Serving
- 📋Others
*
beginnt, bedeutet dies, dass das Projekt weder Open Source ist noch Anwendungen veröffentlicht hat.
- Command-R: Command-R ist ein skalierbares generatives Modell, das auf RAG und Tool Use abzielt, um KI im Produktionsmaßstab für Unternehmen zu ermöglichen.
- Grok-1: Grok-1 ist ein 314 Milliarden Parameter Mixture-of-Experts Modell, das von xAI von Grund auf neu trainiert wurde.
- Mistral: Mistral AI veröffentlicht Open Source LLMs, darunter Mistral 7B, Mistral 8x7B und Codestral.
- DBRX: DBRX ist ein offenes, allgemeines LLM, das von Databricks erstellt wurde.
- mPLUG-DocOwl: Modularisiertes Multimodales Großes Sprachmodell für die Dokumentenverständnis.
- OpenChat: Fortschrittliche Open-Source-Sprachmodelle mit unvollständigen Daten
- WizardLM: Stärkung großer vortrainierter Sprachmodelle zur Befolgung komplexer Anweisungen
- CodeGemma-7b: Eine offizielle Google-Veröffentlichung für Code-LLMs.
- Awesome-Chinese-LLM: Enthält viele Open-Source-Chinesische LLMs.
- llama3: Meta neu veröffentlichte LLMs.
- Snowflake Arctic: Arctic ist eine dichte-MoE-Hybrid-Transformator-Architektur, die von Grund auf vom Snowflake AI Research Team vortrainiert wurde. Durchschnittlich werden Codierung (HumanEval+ und MBPP+), SQL-Generierung (Spider) und Anweisungsbefolgung (IFEval) verwendet.
- DeepSeek-V2-Chat: Ein starkes, wirtschaftliches und effizientes Mixture-of-Experts Sprachmodell
- Qwen 1.8B,7B,14B,72B: Chat- und vortrainiertes großes Sprachmodell, vorgeschlagen von Alibaba Cloud.
- Granite Code Models 3b,8b,20b,34b: Granite Code Models, IBMs Open-Source-Code-Modelle: Eine Familie von Open Foundation Models für Code Intelligence
- Hunyuan-DiT: Ein leistungsstarker Multi-Resolution-Diffusion-Transformator mit feinkörnigem chinesischem Verständnis
- MiniCPM-V 2.0: Ein effizientes Endseitiges MLLM mit starken OCR- und Verständnisfähigkeiten
- Stable Audio Open 1.0: Stable Audio Open 1.0 generiert variabel lange (bis zu 47s) Stereo-Audio mit 44,1 kHz aus Text-Prompts.
- Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, und Qwen2-72B: Qwen2 ist die große Sprachmodellserie, die vom Qwen-Team, Alibaba Cloud, entwickelt wurde.
- GLM-4-9B: GLM-4-Serie: Offene mehrsprachige multimodale Chat-LMs
- AutoCoder: Ein neues Modell, das für die Code-Generierungsaufgabe entwickelt wurde. Seine Testgenauigkeit auf dem HumanEval-Basisdatensatz übertrifft die von GPT-4 Turbo (April 2024) und GPT-4o.
- Nemotron 4 340B: Die offenen Modelle von Nvidia für die Generierung synthetischer Daten (SDG). Enthält Basis-, Anweisungs- und Belohnungsmodelle.
- Fish Speech V1.2: Fish Speech V1.2 ist ein führendes Text-to-Speech (TTS) Modell, das auf 300.000 Stunden englischer, chinesischer und japanischer Audiodaten trainiert wurde.
- Phi-3 Familie: Phi-3 Familie kleiner Sprach- und multimodaler Modelle. Sprachmodelle sind in kurzen und langen Kontextlängen verfügbar.
- Gemma 2: Gemma 2 bietet erstklassige Leistung, läuft mit unglaublicher Geschwindigkeit auf verschiedenen Hardware und lässt sich leicht in andere AI-Tools integrieren.
- open_llm_leaderboard: Dies ist die zentrale Organisation (HuggingFace), die das Open LLM Leaderboard pflegt.
- LMSys Chatbot Arena Leaderboard: Eine crowdsourced, randomisierte Battle-Plattform. Verwenden Sie Benutzerstimmen, um Elo-Bewertungen zu berechnen.
- META Leaderboard: Massive Text Embedding Benchmark (MTEB) Leaderboard.
- LLM-Perf Leaderboard: Ziel ist es, die Leistung (Latenz, Durchsatz und Speicher) von LLMs mit verschiedenen Hardware, Backends und Optimierungen unter Verwendung von Optimum-Benchmark und Optimum-Flavors zu benchmarken.
- Big Code Models Leaderboard: Vergleichen Sie die Leistung von Basis-Mehrsprachigen Code-Generierungsmodellen auf dem HumanEval-Benchmark und MultiPL-E.
- Open ASR Leaderboard: Rangieren und bewerten Sie Spracherkennungsmodelle auf dem Hugging Face Hub.
- Toolbench Leaderboard: Eine Bewertung der LLM-Tool-Manipulationsfähigkeiten.
- OpenCompass 2.0 LLM Leaderboard: Bietet umfassende, objektive und neutrale Bewertungen und Rankings für erstklassige große Sprachmodelle und multimodale Modelle.
- Open Ko-LLM Leaderboard: Bewertet die Leistung des koreanischen großen Sprachmodells (LLM).
- ChatGPT: ChatGPT ist ein kostenlos nutzbares AI-System. Verwenden Sie es für ansprechende Gespräche, gewinnen Sie Einblicke, automatisieren Sie Aufgaben und erleben Sie die Zukunft der AI, alles an einem Ort.
- Gemini: Bard ist jetzt Gemini. Holen Sie sich Hilfe beim Schreiben, Planen, Lernen und mehr von Google AI.
- character.ai: Wo intelligente Agenten leben!
- Claude: Sprechen Sie mit Claude, einem AI-Assistenten von Anthropic.
- Mistral AI: Mistral macht fortschrittliche AI allgegenwärtig und bietet maßgeschneiderte AI für alle Entwickler.
Einschließlich Text zu Sprache, Sprache zu Text, Sprache zu Sprache, Sprachgenerierung:
- *Vall-E: Ein neuronales Codec-Sprachmodell für die Sprachsynthese.
- ElevenLabs: AI Voice Generator & Text to Speech
- Whisper: Robuste Spracherkennung durch großflächige schwache Überwachung
- Krisp: Krisp unterdrückt Hintergrundgeräusche und reduziert Echo während Ihrer Anrufe.
- Voicemod: Voicemod ist ein kostenloser Echtzeit-Stimmenverzerrer und Soundboard, verfügbar sowohl auf Windows als auch auf macOS.
- *NaturalSpeech 3: Zero-Shot-Sprachsynthese mit faktorisierter Codec- und Diffusionsmodellen.
- VoiceCraft: VoiceCraft ist Zero-Shot-Sprachediting und Text-to-Speech in freier Wildbahn.
- Parler-TTS: Parler-TTS ist ein leichtgewichtiges Text-to-Speech (TTS) Modell, das hochwertige, natürlich klingende Sprache im Stil eines gegebenen Sprechers (Geschlecht, Tonhöhe, Sprechstil usw.) erzeugen kann.
- Sounds: Sounds für Kreative, Spieleentwickler, Künstler, Videomacher. Erleben Sie den besten AI Sound FX Generator
- VIVA: VIVA ist die AI-gestützte kreative visuelle Designplattform
- ChatTTS: ChatTTS ist ein generatives Sprachmodell für den täglichen Dialog.
- StreamSpeech: StreamSpeech ist ein nahtloses "All in One" Modell für Offline- und gleichzeitige Spracherkennung, Sprachübersetzung und Sprachsynthese.
- Dream Machine: Dream Machine ist ein AI-Modell, das schnell hochwertige, realistische Videos aus Text und Bildern erstellt.
- CosyVoice: Mehrsprachiges großes Sprachgenerierungsmodell, das Inferenz-, Trainings- und Bereitstellungs-Full-Stack-Fähigkeiten bietet.
- Suno: Suno ist ein innovatives Tool zur Musikproduktion, das künstliche Intelligenz nutzt, um Texteingaben in Originalsongs zu verwandeln
- Udio: Machen Sie Ihre Musik. Entdecken, erstellen und teilen Sie Musik mit der Welt.
- Haimian Music: Ein von ByteDance entwickeltes AI-generiertes Musikprodukt, das sowohl in Chinesisch als auch in Englisch eine überlegene Gesangsqualität bietet.
- Jamboss: Jamboss ist eine super einfache AI-Musikgenerator-App, mit der Sie Ihre Ideen und Texte in erstaunliche vollständige Songs verwandeln können.
Einschließlich Text zu Bild, Bild zu Bild und Animation:
- DALL-E: Erstellen von Bildern aus Text.
- Stable Diffusion: Stable Diffusion ist ein Deep-Learning-Text-zu-Bild-Modell.
- Midjourney: Midjourney ist ein generatives künstliches Intelligenzprogramm und -dienst, das Bilder aus natürlichen Sprachbeschreibungen erstellt, ähnlich wie andere AI-Technologien wie OpenAIs DALL-E und Stability AIs Stable Diffusion.
- StickerBaker: StickerBaker ist ein Open-Source-Tool, das es Benutzern ermöglicht, Aufkleber mit AI-Technologie zu erstellen.
- *PIXART-Σ: Schwach-zu-Stark-Training des Diffusionstransformators für 4K-Text-zu-Bild-Generierung.
- ResAdapter: ResAdapter ist ein Plug-and-Play-Resolution-Adapter, der Diffusionsmodelle beliebiger Stil-Domänen ermöglicht, auflösungsfreie Bilder zu erzeugen: keine zusätzliche Schulung, keine zusätzliche Inferenz und kein Stiltransfer.
- FaceChain: FaceChain ist eine Deep-Learning-Toolchain zur Erstellung Ihres digitalen Zwillings.
- APISR: Anime Production Inspired Real-World Anime Super-Resolution (CVPR 2024)
- OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models: OMG ist ein Framework für die Mehrkonzept-Bilderzeugung
- BasicPBC: Lernen von Inklusionsabgleich für die Animation Paint Bucket Colorization.
- DesignEdit: Mehrschichtige latente Dekomposition und Fusion für einheitliche und präzise Bildbearbeitung.
- VAR: eine neue visuelle Generierungsmethode, die GPT-Style-Modelle über Diffusion hinaushebt und Skalierungsgesetze beobachtet.
- Ideogram: Ideogram ist ein kostenloses AI-Tool, das realistische Bilder, Poster, Logos und mehr generiert.
- MagicClothing: Fokus auf kontrollierbare kleidungsgetriebene Bildsynthese.
- *IntrinsicAnything: Lernen von Diffusionsprioren für die inverse Wiedergabe unter unbekannter Beleuchtung.
- HeyBeauty: Entdecken Sie Schönheit mit AI, machen Sie Mode neu definiert.
- IC-Light: IC-Light ist ein Projekt zur Manipulation der Beleuchtung von Bildern.
- Logo Diffusion: Erstellen Sie Logos in Sekunden mit generativer A.I.
- MistoLine: Ein vielseitiges und robustes SDXL-ControlNet-Modell für anpassbare Line-Art-Konditionierung
- InstaDrag: Blitzschnelle und präzise Drag-basierte Bildbearbeitung, die aus Videos hervorgeht
- Omost: Omost ist ein Projekt zur Umwandlung der Codierungsfähigkeit von LLM in die Fähigkeit zur Bildgenerierung (oder genauer gesagt zur Bildkomposition).
- ToonCrafter: ToonCrafter kann zwei Cartoon-Bilder interpolieren, indem es die vortrainierten Bild-zu-Video-Diffusionsprioren nutzt.
- Hallo: Hierarchische Audio-gestützte visuelle Synthese für die Animation von Porträtbildern
- UniAnimate: Zähmung einheitlicher Videodiffusionsmodelle für konsistente menschliche Bildanimation.
- Krea: Erstellen und verbessern Sie Bilder und Videos mit leistungsstarker AI kostenlos.
- Leonardo AI: Leonardo AI ist ein generatives AI-Tool, mit dem Sie erstklassige visuelle Assets für Ihre Projekte erstellen können.
- MimicBrush: Zero-Shot-Bildbearbeitung mit Referenzimitation
- SketchDeco: Dekorieren von Schwarz-Weiß-Skizzen mit Farbe.
- Tensor.Art: AI-Modell-Sharing-Plattform, Online-Modelle ausführen, um Bilder zu generieren und Modelle kostenlos zu trainieren.
- AutoStudio: AutoStudio: Erstellen konsistenter Subjekte in der interaktiven Bildgenerierung mit mehreren Runden
- LivePortrait: Effiziente Porträtanimation mit Stitching- und Retargeting-Steuerung
- IMAGDressing: Interaktive modulare Bekleidungsgenerierung für virtuelles Ankleiden
- PaintsUndo: Ein Basismodell von Zeichenverhalten in digitalen Gemälden
Einschließlich Text zu 3D-Modell:
- TripoSR: TripoSR ist ein schnelles und vorwärtsgerichtetes 3D-Generierungsmodell, das in Zusammenarbeit zwischen Stability AI und Tripo AI entwickelt wurde.
- PantoMatrix: PantoMatrix: Generierung von sprechenden Gesichts- und Körperanimationen
- Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians.
- *Make-It-Vivid: Ankleiden Ihrer animierbaren zweibeinigen Cartoon-Charaktere aus Text.
- *CAT3D: CAT3D: Erstellen Sie alles in 3D mit Multi-View-Diffusionsmodellen
- DiffTF: Großes Vokabular 3D-Diffusionsmodell mit Transformator
- DreamMat: Hochwertige PBR-Materialgenerierung mit geometrie- und lichtbewussten Diffusionsmodellen
- Unique3D: Hochwertige und effiziente 3D-Mesh-Generierung aus einem einzigen Bild.
- Era3D: Hochauflösende Multiview-Diffusion mit effizienter zeilenweiser Aufmerksamkeit.
- *OccFusion: Rendering von verdeckten Menschen mit generativen Diffusionsprioren
- AIUNI: AI generiert einzigartige Assets, Avatare, Animationen.
- MeshFormer: Hochwertige Mesh-Generierung mit 3D-geführt