Build software better, together

NeuralNodeOne814 / LocalineAI

LocalineAI brings powerful AI capabilities directly to your Windows terminal while keeping your data completely private and secure. No cloud dependencies, no data sharing - just pure AI power at your fingertips.

text-generation artificial-intelligence image-generation code-generation windows-automation cli-tool privacy-focused ai-privacy local-processing ai-assistant ai-automation generative-ai local-llm local-ai open-source-ai offline-ai multimodal-ai windows-ai offline-assistant

Updated May 24, 2025

CyberLinkGamma314 / LocalineAI

Star

LocalineAI brings powerful AI capabilities directly to your Windows terminal while keeping your data completely private and secure. No cloud dependencies, no data sharing - just pure AI power at your fingertips.

text-generation artificial-intelligence image-generation code-generation windows-automation cli-tool privacy-focused ai-privacy local-processing ai-assistant ai-automation generative-ai local-llm local-ai open-source-ai offline-ai multimodal-ai windows-ai offline-assistant

Updated May 24, 2025

BinarySyncBeta995 / LocalineAI

Star

LocalineAI brings powerful AI capabilities directly to your Windows terminal while keeping your data completely private and secure. No cloud dependencies, no data sharing - just pure AI power at your fingertips.

text-generation artificial-intelligence image-generation code-generation windows-automation cli-tool privacy-focused ai-privacy local-processing ai-assistant ai-automation generative-ai local-llm local-ai open-source-ai offline-ai multimodal-ai windows-ai offline-assistant

Updated May 24, 2025

NanoNetGamma531 / LocalineAI

Star

LocalineAI brings powerful AI capabilities directly to your Windows terminal while keeping your data completely private and secure. No cloud dependencies, no data sharing - just pure AI power at your fingertips.

text-generation artificial-intelligence image-generation code-generation windows-automation cli-tool privacy-focused ai-privacy local-processing ai-assistant ai-automation generative-ai local-llm local-ai open-source-ai offline-ai multimodal-ai windows-ai offline-assistant

Updated May 24, 2025

sinanuozdemir / oreilly-multimodal-ai

Star

Learn how multimodal AI merges text, image, and audio for smarter models

openai diffusion multimodal deepgram livekit stable-diffusion dreambooth generative-ai llava dalle-3 llama3 multimodal-ai

Updated Jan 21, 2025
Jupyter Notebook

neocortex-link / neocortex-unity-sdk

Star

Neocortex Unity SDK for Smart NPCs and Virtual Assistants

ai game-development npc npcs game-ai ai-agents conversational-ai smart-agent ai-tools ai-agent aiagent smart-agents aiagents multimodal-ai smart-npc smart-npcs

Updated Apr 2, 2025
C#

microsoft / multimodal-ai

Star

Enterprise-ready solution leveraging multimodal Generative AI (Gen AI) to enhance existing or new applications beyond text—implementing RAG, image classification, video analysis, and advanced image embeddings.

python ai azure video-analysis azure-ai enterprise-ai multimodal-ai

Updated May 27, 2025
HCL

alperensumeroglu / ai-clips-maker

Star

AI-powered tool to turn long videos into short, viral-ready clips. Combines transcription, speaker diarization, scene detection & 9:16 resizing — perfect for creators & smart automation.

Updated Apr 2, 2025
Python

Livyatan-melvillei / ai-clips-maker

Star

AI-powered tool to turn long videos into short, viral-ready clips. Combines transcription, speaker diarization, scene detection & 9:16 resizing — perfect for creators & smart automation.

automatic-speech-recognition media-processing temporal-segmentation ml-pipeline ffmpeg-python deep-learning-pipelines video-scene-detection video-transcription huggingface-pipelines multimodal-ai video-resizing ai-video-summarization video-clip-generation intelligent-video-editing

Updated May 31, 2025
Python

mghiasvand1 / Awesome-VLM-Synthetic-Data

Star

🔥 The first survey on bridging VLMs and synthetic data, for which I completed the entire process of reading 125 papers and writing the research paper in just 10 days.

awesome survey synthetic-data generative-ai vision-language-models multimodal-ai

Updated May 24, 2025

VectorInstitute / VLDBench

Star

VLDBench: A large-scale benchmark for evaluating Vision-Language Models (VLMs) and Large Language Models (LLMs) on multimodal disinformation detection.

nlp benchmarking machine-learning computer-vision deep-learning datasets benchmark-framework ai-safety llm vlms vision-language-models multimodal-ai disinformation-detection

Updated May 30, 2025
Python

Md-Emon-Hasan / Gen-AI-on-going

Star

ChatGPT said: Generative AI (Gen AI) is a branch of artificial intelligence that creates new content such as text, images, audio, or code using models like GPT or Gemini. It powers applications like AI chatbots, image generation tools, and creative assistants across various industries.

Updated Apr 23, 2025
Jupyter Notebook

hi-space / amazon-bedrock-nova-gallery

Star

Gallery showcasing AI-generated images and videos created using the Nova model

bedrock text-to-image image-to-video text-to-video generative-ai multimodal-ai

Updated Feb 1, 2025
Python

AHMEDSANA / PaliGemma-flickr8k-finetuning

Star

This repository contains code for fine-tuning Google's PaliGemma vision-language model on the Flickr8k dataset for image captioning tasks

Updated May 25, 2025
Jupyter Notebook

mims-harvard / mims-harvard.github.io

Star

Lab website

therapeutics generative-ai biomedical-ai agentic-ai multimodal-ai

Updated May 27, 2025
HTML

krishnakaushik25 / AI-MiniLabs

Star

A hands-on collection of experimental AI mini-projects exploring large language models, multimodal reasoning, retrieval-augmented generation (RAG), reinforcement learning, and real-world applications in finance, eKYC, and voice interfaces.

nlp computer-vision large-language-models genai retrieval-augmented-generation gpt-4o multimodal-ai

Updated May 29, 2025
Jupyter Notebook

W3JDev / FlairAi

Star

Ai FnB Service & Menu Training Assistant Powered by Gemini & Google Cloud

react audio training api typescript google-cloud gemini conversational-ai livestreaming prompt-engineering generative-ai realtime-streaming multimodal-ai rolepaly

Updated May 29, 2025

3bdulah / multimodal-diagnosis

Star

Multi-modal AI system for diagnosing respiratory diseases using Vision Transformers and BERT.

nlp computer-vision deep-learning transformers pytorch healthcare diagnosis bert chest-xrays multimodal-deep-learning vision-transformer multimodal-ai

Updated May 9, 2025
Python

virgo-200 / LocalineAI

Star

LocalineAI brings powerful AI capabilities directly to your Windows terminal while keeping your data completely private and secure. No cloud dependencies, no data sharing - just pure AI power at your fingertips.

text-generation artificial-intelligence image-generation code-generation windows-automation cli-tool privacy-focused ai-privacy local-processing ai-assistant ai-automation generative-ai local-llm local-ai open-source-ai offline-ai multimodal-ai windows-ai offline-assistant

Updated May 24, 2025

ksm26 / Large-Multimodal-Model-Prompting-with-Gemini

Star

The teaches you to integrate text, images, and videos into applications using Gemini's state-of-the-art multimodal models. Learn advanced prompting techniques, cross-modal reasoning, and how to extend Gemini's capabilities with real-time data and API integration.

semantic-search video-qa api-integration prompt-engineering function-calling gemini-models multimodal-ai text-image-video-integration cross-modal-reasoning content-summarization virtual-interior-design

Updated Sep 2, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

multimodal-ai

Here are 27 public repositories matching this topic...

NeuralNodeOne814 / LocalineAI

CyberLinkGamma314 / LocalineAI

BinarySyncBeta995 / LocalineAI

NanoNetGamma531 / LocalineAI

sinanuozdemir / oreilly-multimodal-ai

neocortex-link / neocortex-unity-sdk

microsoft / multimodal-ai

alperensumeroglu / ai-clips-maker

Livyatan-melvillei / ai-clips-maker

mghiasvand1 / Awesome-VLM-Synthetic-Data

VectorInstitute / VLDBench

Md-Emon-Hasan / Gen-AI-on-going

hi-space / amazon-bedrock-nova-gallery

AHMEDSANA / PaliGemma-flickr8k-finetuning

mims-harvard / mims-harvard.github.io

krishnakaushik25 / AI-MiniLabs

W3JDev / FlairAi

3bdulah / multimodal-diagnosis

virgo-200 / LocalineAI

ksm26 / Large-Multimodal-Model-Prompting-with-Gemini

Improve this page

Add this topic to your repo

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.