Skip to content

Latest commit

 

History

History
168 lines (152 loc) · 18.9 KB

README.de.md

File metadata and controls

168 lines (152 loc) · 18.9 KB

🤖 Unser Ziel ist es, eine umfassende Sammlung von Projekten zu erstellen und zu pflegen, die die bemerkenswerte Vielseitigkeit und das Potenzial von LLM-Anwendungen demonstrieren.

Projektindex:

Projekte

‼️Achtung: Wenn der Projektname mit * beginnt, bedeutet dies, dass das Projekt weder Open Source ist noch Anwendungen veröffentlicht hat.

🦄 LLMs

  • Command-R: Command-R ist ein skalierbares generatives Modell, das auf RAG und Tool Use abzielt, um KI im Produktionsmaßstab für Unternehmen zu ermöglichen.
  • Grok-1: Grok-1 ist ein 314 Milliarden Parameter Mixture-of-Experts Modell, das von xAI von Grund auf neu trainiert wurde.
  • Mistral: Mistral AI veröffentlicht Open Source LLMs, darunter Mistral 7B, Mistral 8x7B und Codestral.
  • DBRX: DBRX ist ein offenes, allgemeines LLM, das von Databricks erstellt wurde.
  • mPLUG-DocOwl: Modularisiertes Multimodales Großes Sprachmodell für die Dokumentenverständnis.
  • OpenChat: Fortschrittliche Open-Source-Sprachmodelle mit unvollständigen Daten
  • WizardLM: Stärkung großer vortrainierter Sprachmodelle zur Befolgung komplexer Anweisungen
  • CodeGemma-7b: Eine offizielle Google-Veröffentlichung für Code-LLMs.
  • Awesome-Chinese-LLM: Enthält viele Open-Source-Chinesische LLMs.
  • llama3: Meta neu veröffentlichte LLMs.
  • Snowflake Arctic: Arctic ist eine dichte-MoE-Hybrid-Transformator-Architektur, die von Grund auf vom Snowflake AI Research Team vortrainiert wurde. Durchschnittlich werden Codierung (HumanEval+ und MBPP+), SQL-Generierung (Spider) und Anweisungsbefolgung (IFEval) verwendet.
  • DeepSeek-V2-Chat: Ein starkes, wirtschaftliches und effizientes Mixture-of-Experts Sprachmodell
  • Qwen 1.8B,7B,14B,72B: Chat- und vortrainiertes großes Sprachmodell, vorgeschlagen von Alibaba Cloud.
  • Granite Code Models 3b,8b,20b,34b: Granite Code Models, IBMs Open-Source-Code-Modelle: Eine Familie von Open Foundation Models für Code Intelligence
  • Hunyuan-DiT: Ein leistungsstarker Multi-Resolution-Diffusion-Transformator mit feinkörnigem chinesischem Verständnis
  • MiniCPM-V 2.0: Ein effizientes Endseitiges MLLM mit starken OCR- und Verständnisfähigkeiten
  • Stable Audio Open 1.0: Stable Audio Open 1.0 generiert variabel lange (bis zu 47s) Stereo-Audio mit 44,1 kHz aus Text-Prompts.
  • Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, und Qwen2-72B: Qwen2 ist die große Sprachmodellserie, die vom Qwen-Team, Alibaba Cloud, entwickelt wurde.
  • GLM-4-9B: GLM-4-Serie: Offene mehrsprachige multimodale Chat-LMs
  • AutoCoder: Ein neues Modell, das für die Code-Generierungsaufgabe entwickelt wurde. Seine Testgenauigkeit auf dem HumanEval-Basisdatensatz übertrifft die von GPT-4 Turbo (April 2024) und GPT-4o.
  • Nemotron 4 340B: Die offenen Modelle von Nvidia für die Generierung synthetischer Daten (SDG). Enthält Basis-, Anweisungs- und Belohnungsmodelle.
  • Fish Speech V1.2: Fish Speech V1.2 ist ein führendes Text-to-Speech (TTS) Modell, das auf 300.000 Stunden englischer, chinesischer und japanischer Audiodaten trainiert wurde.
  • Phi-3 Familie: Phi-3 Familie kleiner Sprach- und multimodaler Modelle. Sprachmodelle sind in kurzen und langen Kontextlängen verfügbar.
  • Gemma 2: Gemma 2 bietet erstklassige Leistung, läuft mit unglaublicher Geschwindigkeit auf verschiedenen Hardware und lässt sich leicht in andere AI-Tools integrieren.

🏆 Benchmarks Leaderboard

  • open_llm_leaderboard: Dies ist die zentrale Organisation (HuggingFace), die das Open LLM Leaderboard pflegt.
  • LMSys Chatbot Arena Leaderboard: Eine crowdsourced, randomisierte Battle-Plattform. Verwenden Sie Benutzerstimmen, um Elo-Bewertungen zu berechnen.
  • META Leaderboard: Massive Text Embedding Benchmark (MTEB) Leaderboard.
  • LLM-Perf Leaderboard: Ziel ist es, die Leistung (Latenz, Durchsatz und Speicher) von LLMs mit verschiedenen Hardware, Backends und Optimierungen unter Verwendung von Optimum-Benchmark und Optimum-Flavors zu benchmarken.
  • Big Code Models Leaderboard: Vergleichen Sie die Leistung von Basis-Mehrsprachigen Code-Generierungsmodellen auf dem HumanEval-Benchmark und MultiPL-E.
  • Open ASR Leaderboard: Rangieren und bewerten Sie Spracherkennungsmodelle auf dem Hugging Face Hub.
  • Toolbench Leaderboard: Eine Bewertung der LLM-Tool-Manipulationsfähigkeiten.
  • OpenCompass 2.0 LLM Leaderboard: Bietet umfassende, objektive und neutrale Bewertungen und Rankings für erstklassige große Sprachmodelle und multimodale Modelle.
  • Open Ko-LLM Leaderboard: Bewertet die Leistung des koreanischen großen Sprachmodells (LLM).

💬 ChatBot

  • ChatGPT: ChatGPT ist ein kostenlos nutzbares AI-System. Verwenden Sie es für ansprechende Gespräche, gewinnen Sie Einblicke, automatisieren Sie Aufgaben und erleben Sie die Zukunft der AI, alles an einem Ort.
  • Gemini: Bard ist jetzt Gemini. Holen Sie sich Hilfe beim Schreiben, Planen, Lernen und mehr von Google AI.
  • character.ai: Wo intelligente Agenten leben!
  • Claude: Sprechen Sie mit Claude, einem AI-Assistenten von Anthropic.
  • Mistral AI: Mistral macht fortschrittliche AI allgegenwärtig und bietet maßgeschneiderte AI für alle Entwickler.

🗣️ Voice

Einschließlich Text zu Sprache, Sprache zu Text, Sprache zu Sprache, Sprachgenerierung:

  • *Vall-E: Ein neuronales Codec-Sprachmodell für die Sprachsynthese.
  • ElevenLabs: AI Voice Generator & Text to Speech
  • Whisper: Robuste Spracherkennung durch großflächige schwache Überwachung
  • Krisp: Krisp unterdrückt Hintergrundgeräusche und reduziert Echo während Ihrer Anrufe.
  • Voicemod: Voicemod ist ein kostenloser Echtzeit-Stimmenverzerrer und Soundboard, verfügbar sowohl auf Windows als auch auf macOS.
  • *NaturalSpeech 3: Zero-Shot-Sprachsynthese mit faktorisierter Codec- und Diffusionsmodellen.
  • VoiceCraft: VoiceCraft ist Zero-Shot-Sprachediting und Text-to-Speech in freier Wildbahn.
  • Parler-TTS: Parler-TTS ist ein leichtgewichtiges Text-to-Speech (TTS) Modell, das hochwertige, natürlich klingende Sprache im Stil eines gegebenen Sprechers (Geschlecht, Tonhöhe, Sprechstil usw.) erzeugen kann.
  • Sounds: Sounds für Kreative, Spieleentwickler, Künstler, Videomacher. Erleben Sie den besten AI Sound FX Generator
  • VIVA: VIVA ist die AI-gestützte kreative visuelle Designplattform
  • ChatTTS: ChatTTS ist ein generatives Sprachmodell für den täglichen Dialog.
  • StreamSpeech: StreamSpeech ist ein nahtloses "All in One" Modell für Offline- und gleichzeitige Spracherkennung, Sprachübersetzung und Sprachsynthese.
  • Dream Machine: Dream Machine ist ein AI-Modell, das schnell hochwertige, realistische Videos aus Text und Bildern erstellt.
  • CosyVoice: Mehrsprachiges großes Sprachgenerierungsmodell, das Inferenz-, Trainings- und Bereitstellungs-Full-Stack-Fähigkeiten bietet.

🎵 Music

  • Suno: Suno ist ein innovatives Tool zur Musikproduktion, das künstliche Intelligenz nutzt, um Texteingaben in Originalsongs zu verwandeln
  • Udio: Machen Sie Ihre Musik. Entdecken, erstellen und teilen Sie Musik mit der Welt.
  • Haimian Music: Ein von ByteDance entwickeltes AI-generiertes Musikprodukt, das sowohl in Chinesisch als auch in Englisch eine überlegene Gesangsqualität bietet.
  • Jamboss: Jamboss ist eine super einfache AI-Musikgenerator-App, mit der Sie Ihre Ideen und Texte in erstaunliche vollständige Songs verwandeln können.

🌄 Image

Einschließlich Text zu Bild, Bild zu Bild und Animation:

  • DALL-E: Erstellen von Bildern aus Text.
  • Stable Diffusion: Stable Diffusion ist ein Deep-Learning-Text-zu-Bild-Modell.
  • Midjourney: Midjourney ist ein generatives künstliches Intelligenzprogramm und -dienst, das Bilder aus natürlichen Sprachbeschreibungen erstellt, ähnlich wie andere AI-Technologien wie OpenAIs DALL-E und Stability AIs Stable Diffusion.
  • StickerBaker: StickerBaker ist ein Open-Source-Tool, das es Benutzern ermöglicht, Aufkleber mit AI-Technologie zu erstellen.
  • *PIXART-Σ: Schwach-zu-Stark-Training des Diffusionstransformators für 4K-Text-zu-Bild-Generierung.
  • ResAdapter: ResAdapter ist ein Plug-and-Play-Resolution-Adapter, der Diffusionsmodelle beliebiger Stil-Domänen ermöglicht, auflösungsfreie Bilder zu erzeugen: keine zusätzliche Schulung, keine zusätzliche Inferenz und kein Stiltransfer.
  • FaceChain: FaceChain ist eine Deep-Learning-Toolchain zur Erstellung Ihres digitalen Zwillings.
  • APISR: Anime Production Inspired Real-World Anime Super-Resolution (CVPR 2024)
  • OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models: OMG ist ein Framework für die Mehrkonzept-Bilderzeugung
  • BasicPBC: Lernen von Inklusionsabgleich für die Animation Paint Bucket Colorization.
  • DesignEdit: Mehrschichtige latente Dekomposition und Fusion für einheitliche und präzise Bildbearbeitung.
  • VAR: eine neue visuelle Generierungsmethode, die GPT-Style-Modelle über Diffusion hinaushebt und Skalierungsgesetze beobachtet.
  • Ideogram: Ideogram ist ein kostenloses AI-Tool, das realistische Bilder, Poster, Logos und mehr generiert.
  • MagicClothing: Fokus auf kontrollierbare kleidungsgetriebene Bildsynthese.
  • *IntrinsicAnything: Lernen von Diffusionsprioren für die inverse Wiedergabe unter unbekannter Beleuchtung.
  • HeyBeauty: Entdecken Sie Schönheit mit AI, machen Sie Mode neu definiert.
  • IC-Light: IC-Light ist ein Projekt zur Manipulation der Beleuchtung von Bildern.
  • Logo Diffusion: Erstellen Sie Logos in Sekunden mit generativer A.I.
  • MistoLine: Ein vielseitiges und robustes SDXL-ControlNet-Modell für anpassbare Line-Art-Konditionierung
  • InstaDrag: Blitzschnelle und präzise Drag-basierte Bildbearbeitung, die aus Videos hervorgeht
  • Omost: Omost ist ein Projekt zur Umwandlung der Codierungsfähigkeit von LLM in die Fähigkeit zur Bildgenerierung (oder genauer gesagt zur Bildkomposition).
  • ToonCrafter: ToonCrafter kann zwei Cartoon-Bilder interpolieren, indem es die vortrainierten Bild-zu-Video-Diffusionsprioren nutzt.
  • Hallo: Hierarchische Audio-gestützte visuelle Synthese für die Animation von Porträtbildern
  • UniAnimate: Zähmung einheitlicher Videodiffusionsmodelle für konsistente menschliche Bildanimation.
  • Krea: Erstellen und verbessern Sie Bilder und Videos mit leistungsstarker AI kostenlos.
  • Leonardo AI: Leonardo AI ist ein generatives AI-Tool, mit dem Sie erstklassige visuelle Assets für Ihre Projekte erstellen können.
  • MimicBrush: Zero-Shot-Bildbearbeitung mit Referenzimitation
  • SketchDeco: Dekorieren von Schwarz-Weiß-Skizzen mit Farbe.
  • Tensor.Art: AI-Modell-Sharing-Plattform, Online-Modelle ausführen, um Bilder zu generieren und Modelle kostenlos zu trainieren.
  • AutoStudio: AutoStudio: Erstellen konsistenter Subjekte in der interaktiven Bildgenerierung mit mehreren Runden
  • LivePortrait: Effiziente Porträtanimation mit Stitching- und Retargeting-Steuerung
  • IMAGDressing: Interaktive modulare Bekleidungsgenerierung für virtuelles Ankleiden
  • PaintsUndo: Ein Basismodell von Zeichenverhalten in digitalen Gemälden

🧸 3D Model

Einschließlich Text zu 3D-Modell:

  • TripoSR: TripoSR ist ein schnelles und vorwärtsgerichtetes 3D-Generierungsmodell, das in Zusammenarbeit zwischen Stability AI und Tripo AI entwickelt wurde.
  • PantoMatrix: PantoMatrix: Generierung von sprechenden Gesichts- und Körperanimationen
  • Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians.
  • *Make-It-Vivid: Ankleiden Ihrer animierbaren zweibeinigen Cartoon-Charaktere aus Text.
  • *CAT3D: CAT3D: Erstellen Sie alles in 3D mit Multi-View-Diffusionsmodellen
  • DiffTF: Großes Vokabular 3D-Diffusionsmodell mit Transformator
  • DreamMat: Hochwertige PBR-Materialgenerierung mit geometrie- und lichtbewussten Diffusionsmodellen
  • Unique3D: Hochwertige und effiziente 3D-Mesh-Generierung aus einem einzigen Bild.
  • Era3D: Hochauflösende Multiview-Diffusion mit effizienter zeilenweiser Aufmerksamkeit.
  • *OccFusion: Rendering von verdeckten Menschen mit generativen Diffusionsprioren
  • AIUNI: AI generiert einzigartige Assets, Avatare, Animationen.
  • MeshFormer: Hochwertige Mesh-Generierung mit 3D-geführt