HeroUI |
https://github.com/heroui-inc/heroui |
一个美观、快速且现代的开源 React UI 组件库,前身名为 NextUI,提供丰富的可定制组件和优雅的设计风格,帮助开发者高效构建高质量的用户界面。 |
GSAP |
https://gsap.com/ |
一个高性能、功能丰富的免费动画库,支持在 Vue、React 等现代前端框架中使用,提供精确控制和流畅动画效果,适用于构建复杂的交互动画和视觉特效。 |
MediaCrawler |
https://github.com/NanmiCoder/MediaCrawler |
一个功能强大的开源多平台自媒体数据采集工具,支持小红书、抖音、快手、B站、微博、贴吧、知乎等主流平台的公开内容抓取,适用于数据分析、舆情监控和内容研究等场景。 |
es-toolkit |
https://es-toolkit.dev/zh_hans/ |
一个先进的高性能 JavaScript 实用工具库,提供丰富且常用的函数方法,具有极小的打包体积和完善的 TypeScript 类型支持,帮助开发者提升编码效率与代码质量。 |
Vue.js 挑战 |
https://cn-vuejs-challenges.netlify.app/ |
一个面向 Vue.js 开发者的在线挑战平台,通过实践题目帮助用户巩固和提升 Vue 知识,涵盖基础到高级用法,适合用于学习、练习和面试准备。 |
Chrome MCP Server |
https://github.com/hangwin/mcp-chrome |
一个基于 Chrome 插件的模型上下文协议(MCP)服务器,可将浏览器操作和网页内容封装为 MCP 工具,使大语言模型能够通过标准协议与浏览器交互,实现自动化网页任务。 |
Vueform |
https://vueform.com/ |
一个基于 Vue 的开源表单解决方案,提供强大的表单构建、验证和数据处理功能,支持高度自定义,帮助开发者快速创建复杂且交互丰富的表单界面。 |
Kronos |
https://github.com/shiyu-coder/Kronos |
全球首个专为金融 K 线预测设计的开源模型,基于全球 45 个交易所的数据训练,采用自研离散编码技术将 OHLCV 数据转化为 token,利用大规模 Transformer 模型识别各种走势模式。提供从 4.1M 到 499.2M 参数的多种模型选择,具备一键预测接口、完整的微调 pipeline 和在线 Demo(实时展示 BTC/USDT 预测结果),支持 A 股市场数据并通过 Qlib 进行回测验证。适合量化交易研究和金融数据分析,通过 pip 安装依赖后即可使用。 |
RustDesk |
https://github.com/rustdesk/rustdesk |
一个开源的远程桌面软件,使用 Rust 语言编写,支持跨平台远程控制,提供安全、稳定、高性能的桌面访问体验,可自建服务器,保障数据隐私。 |
PanSou |
https://github.com/fish2018/pansou |
一个高性能的开源网盘资源搜索 API 服务,支持通过 Telegram(TG)进行搜索,并提供插件化扩展能力,允许用户自定义数据源和搜索逻辑,方便集成到各类应用中。 |
KISS Translator |
https://github.com/fishjar/kiss-translator |
一个简约开源的双语对照翻译浏览器扩展与油猴脚本,支持划词翻译和页面内容对照显示,帮助用户在阅读外文网页时快速理解内容,提升跨语言浏览体验。 |
Drawnix |
https://github.com/plait-board/drawnix |
Drawnix 是一个开源的在线白板工具,作为一项软件即服务(SaaS),它为用户提供了一个一体化的平台,在这个平台上,用户可以创建思维导图、流程图以及自由绘画。Drawnix 旨在增强团队协作,同时支持创意发想与项目规划等多方面需求。 |
Comlink |
https://github.com/GoogleChromeLabs/comlink |
一个由 Google 开发的开源库,用于简化主线程与 Web Worker 之间的通信,通过透明的代理机制,让开发者可以像调用本地函数一样调用 Worker 中的方法,提升多线程编程体验。 |
LightRAG |
https://github.com/HKUDS/LightRAG |
一个轻量级的检索增强生成(RAG)框架,结合知识图谱技术,实现快速、高效的文本检索与生成,适用于需要低延迟和高准确率的知识密集型应用。 |
chalk |
https://github.com/chalk/chalk |
一个用于美化终端控制台文本输出的流行 Node.js 库,支持颜色、字体样式(如加粗、斜体)和自定义主题,提升命令行工具的日志可读性和视觉体验。 |
PacBao |
https://github.com/Sjj1024/PacBao |
一个开源工具,可将任意网站或基于 Vue、React 等框架的项目快速打包为轻量级(小于 5MB)的跨平台桌面和移动应用,几分钟内完成构建,简化多端部署流程。 |
OpenBB |
https://github.com/OpenBB-finance/OpenBB |
一个开源的金融数据分析平台,提供股票、期权、加密货币、外汇、宏观经济、固定收益等多类市场数据的统一访问接口,并支持丰富的扩展插件,可根据用户需求灵活增强分析能力。 |
React Bits |
https://github.com/DavidHDev/react-bits |
一个开源的 React 组件集合,提供丰富的动画和交互式功能,所有组件完全可自定义,帮助开发者快速构建视觉惊艳、体验卓越的现代化网站。 |
Vue Bits |
https://github.com/DavidHDev/vue-bits |
一个开源的 Vue 组件库,包含丰富的动画与交互功能,所有组件完全可自定义,帮助开发者轻松构建视觉惊艳、体验出色的现代化网站。 |
JoyAgent-JDGenie |
https://github.com/jd-opensource/joyagent-jdgenie |
一个轻量化的通用多智能体开源产品,支持灵活配置和协同工作,适用于多种业务场景的自动化与智能化需求,具备高扩展性和易集成特性。 |
Checkmate |
https://github.com/bluewave-labs/checkmate |
一个开源的在线时间和基础设施监控应用,支持对网站、服务和系统资源的实时状态监测,提供可视化仪表盘和告警功能,帮助团队保障系统稳定性和可用性。 |
Fes.js |
https://github.com/WeBankFinTech/fes.js/ |
一个基于 Vue.js 3.0 的开源前端应用解决方案,由微众银行金融科技团队开发,提供企业级架构、插件化体系和丰富的内置功能,帮助开发者快速构建高性能、可维护的现代化前端应用。 |
Audiblez |
https://github.com/santinic/audiblez |
一个开源工具,可将电子书自动转换为有声书,利用文本转语音(TTS)技术生成自然流畅的音频内容,方便用户在离线或移动场景下收听书籍。 |
kkFileView |
https://github.com/kekingcn/kkFileView |
一个基于 Spring Boot 构建的开源文档在线预览解决方案,支持多种文件格式(如 Office、PDF、图片、视频等)的在线浏览,可轻松集成到企业系统中,实现安全、高效的文件预览功能。 |
keep vue |
https://keepdesign.io/vue |
一个基于 Vue 的 UI 组件库,提供高质量的设计资源和可复用组件,包含付费项目,免费版本可用组件较少,适合追求设计一致性和开发效率的 Vue 应用开发。 |
MCP Gateway (IBM) |
https://github.com/IBM/mcp-context-forge |
一个由 IBM 开源的 MCP 统一网关工具,旨在解决多个 MCP 服务分散管理、协议不统一的问题。通过提供单一入口,将运行在不同端口的 MCP 工具集中管理,支持 HTTP、WebSocket、SSE 和 stdio 等协议之间的转换。内置可视化 Web 界面,便于测试、监控和调试工具运行状态,支持虚拟服务器分组、REST API 适配器(将非 MCP 服务接入)、认证与缓存机制,显著提升多工具集成开发效率。可通过 pip 安装或 Docker 快速部署,适合需要频繁调试和组合 MCP 工具的开发者。 |
Awesome LLM Apps |
https://github.com/Shubhamsaboo/awesome-llm-apps |
一个精选的开源大语言模型(LLM)应用集合,涵盖基于 RAG、AI 智能体、多智能体系统、MCP 和语音代理等前沿技术构建的创新项目,助力开发者学习和构建下一代 AI 应用。 |
WhisperLiveKit |
https://github.com/QuentinFuxa/WhisperLiveKit |
一个开源的实时语音转录工具,基于 Whisper 模型,提供开箱即用的后端服务与简易前端,可将语音流实时转换为文字并直接在浏览器中显示,适用于会议记录、直播字幕等场景。 |
Windows-MCP |
https://github.com/CursorTouch/Windows-MCP |
一个开源的 MCP(Model Context Protocol)工具,允许大语言模型通过标准化接口直接操作 Windows 系统,实现文件管理、应用控制、系统设置等自动化任务。 |
中国独立开发者项目列表 |
https://github.com/1c7/chinese-independent-developer |
一个开源项目,致力于聚合中国独立开发者的各类产品与工具,展示个人开发者的创新成果,促进交流与合作,推动独立开发社区的发展。 |
扣子工作流 |
https://github.com/zprial/cozeworkflows |
一个开源项目,汇集了 200 多个基于“扣子”平台的实用生产力工作流,涵盖自动化、信息处理、内容生成等多个场景,帮助用户快速提升工作效率。 |
国内免费开发工具/服务清单 |
https://github.com/tvvocold/free-for-dev-zh |
一个开源项目,系统性地收集和整理了国内面向开发者的免费或有限免费服务,涵盖 SaaS、PaaS、BaaS 和 IaaS 等类别,帮助开发者降低创业和开发成本。 |
FastAPI-MCP |
https://github.com/tadata-org/fastapi_mcp |
将 FastAPI 接口转 MCP,不改一行代码,0 配置 0 侵入 |
《一人企业方法论》 |
https://github.com/easychen/one-person-businesses-methodology-v2.0 |
一个专为单人创业者和自由职业者设计的开源方法论项目,提供完整的个人业务构建框架与实践指南,涵盖定位、产品、营销、运营等核心环节,助力实现可持续的个体商业成功。 |
Univer |
https://github.com/dream-num/univer |
一个开源的办公套件引擎,支持电子表格、文档和幻灯片等多种文档类型,提供强大的核心功能与高度可扩展的 API,帮助开发者轻松集成和定制在线办公能力。 |
OpenList |
https://github.com/OpenListTeam/OpenList |
一个由社区驱动、注重长期治理的 AList 开源分支,旨在增强项目韧性,防御基于信任的供应链攻击,确保文件列表服务的安全性与可持续发展。 |
Pocket Flow |
https://github.com/the-pocket/PocketFlow |
一个仅用100行代码实现的极简主义大语言模型(LLM)框架,旨在以最简洁的代码演示 LLM 的核心工作原理,适合学习和理解 LLM 基础架构。 |
Kortix AI/Suna |
https://github.com/kortix-ai/suna |
一个全面的开源 AI 智能体平台,支持构建、管理和训练复杂的智能体,可创建从通用助手到专业自动化工具等各类自主行动的 AI 智能体,适用于多种应用场景。 |
Motion |
https://motion.dev/ |
一个为 React、JavaScript 和 Vue 提供的高性能、高质量动画库,支持流畅的交互式动画与手势控制,语法简洁,易于集成,帮助开发者轻松构建现代、生动的用户界面。 |
Bytebot |
https://github.com/bytebot-ai/bytebot |
一个开源的 AI 桌面代理,具备自主操作电脑的能力,可理解用户指令并自动完成各类任务,如文件处理、信息检索、表单填写等,让 AI 真正成为用户的个人智能助手。 |
localForage |
https://github.com/localForage/localForage |
一个高性能的 JavaScript 库,封装了 IndexedDB、WebSQL 和 localStorage,自动优先使用现代浏览器的高效存储机制(如 IndexedDB),并在不支持时优雅降级到 localStorage,提供简单易用的 API 实现大容量、高兼容性的客户端数据持久化。 |
Marker |
https://github.com/datalab-to/marker |
一个快速且准确的开源文档转换工具,支持将 PDF、图片等格式的文档批量转换为 Markdown、JSON、HTML 等结构化文本,保留排版与内容结构,适用于知识管理与数据提取场景。 |
Kavita |
https://github.com/Kareadita/Kavita |
一款快速、功能丰富的开源跨平台阅读服务器,支持漫画、小说、电子书等多种格式,提供流畅的在线阅读体验和多用户管理功能,适合个人或团队搭建私有阅读平台。 |
PDFMathTranslate |
https://github.com/Byaidu/PDFMathTranslate |
一款专注于学术场景的开源 PDF 文档翻译工具,支持数学公式识别与翻译、双语对照阅读,适用于科研人员和学生高效阅读与理解英文技术文献。 |
Jaaz.app |
https://github.com/11cafe/jaaz |
世界上首个开源的多模态创意代理,注重隐私且支持本地运行,集成了设计、创作与自动化功能,被誉为 Lovart、Manus 和 Figma 的结合体,旨在提升创意工作的智能化与便捷性。 |
WeKnora |
https://github.com/Tencent/WeKnora |
腾讯开源的基于大语言模型(LLM)的文档理解与语义检索框架,专为处理结构复杂、内容异构的文档场景设计,支持高精度信息提取与智能检索。 |
Parlant |
https://github.com/emcie-co/parlant |
一个开源的 LLM 智能体框架,专注于提升模型对复杂指令的理解与执行能力,能够更准确地遵循用户指令,完成多样化任务。 |
Get Jobs |
https://github.com/loks666/get_jobs |
一个开源的求职自动化工具,支持在 Boss 直聘、猎聘、51job、拉勾、智联招聘等主流平台自动投递简历。集成 AI 功能,可根据简历和岗位要求生成个性化打招呼文案,支持图片简历发送、智能过滤不活跃 HR 与不符合条件的职位,提供定时投递、企业微信实时进度推送和黑名单自动更新功能,帮助求职者高效管理应聘流程。需本地配置 JDK21、Maven 和 Chrome 环境运行。 |
Awesome Nano Banana Images |
https://github.com/githubssg/awesome-nano-banana-images |
一个精选的 Gemini-2.5-Flash-Image(又称 Nano Banana)生成图像及对应提示词的开源合集,用于探索和学习该模型的图像生成能力与提示工程技巧。 |
Pixelle MCP |
https://github.com/AIDC-AI/Pixelle-MCP |
基于 MCP 协议的 AIGC 开源方案,无需代码即可将 ComfyUI 工作流转换为 MCP 工具,实现大语言模型(LLM)与 ComfyUI 的无缝集成与协同操作。 |
pyfuze |
https://github.com/TanixLu/pyfuze |
一个工具,可将 Python 项目打包成单一的可执行文件,简化部署和分发流程,适用于需要将 Python 应用转为独立程序的场景。 |
ForesightJS |
https://github.com/spaansba/ForesightJS |
一个轻量级的 JavaScript 库,它可以根据用户意图预先加载所需内容。它无需配置即可完全自动运行,支持桌面和移动设备,并采用不同的预测策略。 |
Awesome GPT-4o Images |
https://github.com/jamez-bondos/awesome-gpt4o-images |
一个精选的 GPT-4o 与 gpt-image-1 生成图像及对应提示词的开源合集,用于探索和学习先进的文本到图像生成技术。 |
System Prompts Leaks |
https://github.com/asgeirtj/system_prompts_leaks |
一个开源项目,收集并公开了多个热门大语言模型的系统提示词(System Prompts),帮助开发者理解模型行为、优化提示工程,并用于研究或复现特定的 AI 交互模式。 |
通义点金 |
https://github.com/aliyun/qwen-dianjin |
阿里云推出的面向金融行业的大语言模型,基于通义千问技术打造,专注于金融场景下的信息提取、数据分析、报告生成与风险评估,助力金融机构实现智能化升级。 |
Repomix |
https://github.com/yamadashy/repomix |
一个开源工具,可将整个代码仓库智能打包成一个结构清晰、内容完整的单一文件,专为 AI 代码理解与分析优化,便于模型上下文输入、代码审查或知识库构建。 |
Bytebot |
https://github.com/bytebot-ai/bytebot |
一个开源的 AI 桌面代理工具,具备自主操作电脑完成任务的能力,可作为个人智能助手,支持自动化办公、信息检索、任务执行等场景,旨在提升用户工作效率。 |
Lumen IM |
https://github.com/gzydong/LumenIM |
一个开源的网页版即时通讯项目,前端基于 Naive UI 与 Vue3 构建,后端使用 Go 语言开发,支持实时聊天功能,具备良好的性能与现代用户界面,适合用于私有化部署或二次开发。 |
Mattermost |
https://github.com/mattermost/mattermost |
一个开源的自托管团队协作平台,支持即时聊天、工作流自动化、语音通话、屏幕共享及人工智能集成,可私有化部署,保障数据安全,适用于企业级通信与协作需求。 |
Cordys CRM |
https://github.com/1Panel-dev/CordysCRM |
中国首个开源的AI驱动客户关系管理(CRM)系统,融合信息化、数字化与智能化能力,支持智能客户跟进、数据分析与业务自动化,助力企业提升销售效率与客户管理水平。 |
FireRedTTS-2 |
https://seko.sensetime.com/explore |
一个由商汤科技推出的AI语音合成模型,具备高质量的文本转语音能力,适用于博客朗读、内容创作等场景,支持多种语音风格和自然流畅的发音。 |
MathModelAgent |
https://github.com/jihe520/MathModelAgent |
一个专为数学建模设计的开源智能体,能够自动完成从问题分析、模型构建到求解的全过程,并生成结构完整、格式规范的可直接提交的数学建模论文,大幅提升参赛或科研效率。 |
Inpaint-web |
https://github.com/lxfater/inpaint-web |
一款基于 WebGPU 和 WASM 技术的开源图片修复与高清化工具,支持在浏览器端完成图像去噪、缺失区域填充(inpainting)和分辨率提升(upscaling),无需安装软件,纯前端实现,保护用户隐私。 |
XLeRobot |
https://github.com/Vector-Wangel/XLeRobot |
一个开源的双臂移动家用机器人平台,起售价约 3699 元($660),支持快速组装(<4 小时),具备家务自动化能力。集成键盘、手柄及 VR 控制,支持仿真训练与强化学习(RL),基于 Python/Ubuntu 开发,硬件可扩展,旨在推动低成本具身智能的普及与研究。 |
Shimmy |
https://github.com/Michael-A-Kuykendall/shimmy |
一个极致轻量且高性能的开源本地 AI 推理工具,仅 5MB 单文件,基于 Rust 构建,启动时间低于 100ms,内存占用约 50MB,提供完整的 OpenAI 兼容 API。支持自动发现 Hugging Face、Ollama 及本地模型源,零配置启动,性能全面超越 Ollama,是本地运行大模型的理想选择。 |
xiaohongshu-mcp |
https://github.com/xpzouying/xiaohongshu-mcp |
一个基于 MCP 协议的开源服务器,通过浏览器自动化技术实现小红书平台的 AI 驱动操作。支持登录状态保持、图文内容发布、关键词内容搜索、首页推荐列表获取等功能,可运行于有头或无头浏览器模式。可与 Claude、Cursor、VSCode 等 MCP 客户端集成,实现通过自然语言指令自动化运营小红书账号,提升内容发布与互动效率。使用前需运行登录脚本保存会话状态。 |
Nano Banana 提示词 |
https://github.com/ZHO-ZHO-ZHO/Nano-Bananary |
一个为 Nano Banana(Gemini-2.5-Flash-Image)设计的开源提示词工具,支持多种玩法一键生成,无需手动编写提示词,提供局部涂选和连续编辑功能,降低图像生成门槛。 |
OpenDataV |
https://github.com/AnsGoo/openDataV |
一个纯前端的拖拽式、低代码数据可视化开发平台,支持自由拼接组件以构建炫酷的大屏展示,提供可视化编辑界面,并允许用户开发和接入自定义组件,便于快速搭建专业级数据大屏。 |
auto-i18n-translation-plugins |
https://github.com/auto-i18n/auto-i18n-translation-plugins |
一个前端自动化多语言翻译插件,支持 Vue、React 等主流框架,无需修改源码即可一键实现国际化,内置有道、谷歌翻译服务,支持自定义翻译器,兼容 Webpack、Vite、Rollup 等构建工具,提升多语言开发效率。 |
Morphik |
https://github.com/morphik-org/morphik-core |
一个以图像为核心的开源多模态 RAG(检索增强生成)框架,支持结合图像与文本进行信息检索和生成,适用于需要视觉内容理解与上下文增强的 AI 应用场景。 |
Chart.js |
https://github.com/chartjs/Chart.js |
一个流行、轻量级的开源 JavaScript 图表库,提供简单易用的 API 和丰富的图表类型,支持响应式设计,常用于 Web 应用中快速构建美观的数据可视化图表。 |
RustFS |
https://github.com/RustFS/RustFS |
一个用 Rust 编写的高性能分布式文件系统,旨在作为 MinIO 的现代替代方案,提供高可靠性、高并发访问和低延迟存储,适用于云原生和大规模数据存储场景。 |
IntraScribe |
https://github.com/weynechen/intrascribe |
一款支持内网私有化部署的开源语音转录与总结工具,提供完整的前后端代码,专为团队或单位设计,适用于会议记录、访谈整理等场景,保障数据安全与隐私。 |
Next.js |
https://www.nextjs.cn/ |
一个用于生产环境的 React 框架,支持服务端渲染、静态生成、路由、API 路由等功能,帮助开发者构建高性能、可扩展的现代 Web 应用。 |
Afilmory |
github.com/Afilmory/afilmory |
一个开源工具,可一键搭建专业的个人摄影作品展示网站,帮助摄影师快速创建美观、响应式的在线作品集,无需前端开发经验即可部署个性化摄影展示页面。 |
WailBrew |
github.com/wickenico/WailBrew |
一个开源的 Homebrew 可视化管理工具,提供图形化界面来简化 macOS 上软件包的安装、更新与管理操作,适合不熟悉命令行的用户轻松使用 Homebrew。 |
Atuin Desktop |
github.com/atuinsh/desktop |
一款将文档与终端操作深度融合的开源工具,支持在文档中直接执行 Shell 命令、数据库查询和 HTTP 请求,提升开发与运维效率,实现交互式技术文档与自动化操作的无缝结合。 |
Flying Carpet |
github.com/spieglt/FlyingCarpet |
文件传输工具,无需网络也能直接在设备间传输文件,通过创建临时 WiFi 热点的方式,让两台设备直接连接并传输文件,支持 Android、iOS、Windows、macOS、Linux 全平台互传。 |
Proxifly |
github.com/proxifly/free-proxy-list |
一个开源的免费代理列表工具,每 5 分钟自动更新并验证代理的有效性,帮助用户获取稳定可用的代理IP,适用于需要频繁更换IP或绕过访问限制的场景。 |
NeuTTS Air |
github.com/neuphonic/neutts-air |
一款轻量级开源文本转语音(TTS)模型,仅含 0.5B 参数,可在本地普通电脑高效运行,适合对隐私和离线使用有要求的语音合成场景。 |
EasyOffer |
github.com/jingtian11/EasyOffer |
一份面向大模型岗位的开源面试实战指南,涵盖主流大语言模型的手写代码实现、核心模块详解与真实面经记录,帮助开发者深入理解底层原理,高效准备手写编程题和技术面试。 |
Apple MCP |
github.com/dhravya/apple-mcp |
一个开源的 MCP 工具,使 AI 助手能够直接操作 Mac 上的原生应用(如信息、邮件、日历、提醒事项、通讯录、地图等),支持自动化执行简单任务和复杂的链式操作,提升工作效率。 |
roboflow |
github.com/roboflow/rf-detr |
Roboflow 开源的 RF-DETR 模型,基于 DETR 架构实现高精度的实时目标检测与追踪,适用于需要低延迟、高准确率的计算机视觉应用。 |
oLLM |
github.com/Mega4alik/ollm |
一个专为消费级 GPU 优化的开源大语言模型运行工具,仅需 8GB 显存即可运行高达 80B 参数的大型模型,显著降低本地部署大模型的硬件门槛。 |
ytDownloader |
github.com/aandrew-me/ytdownloader |
一款支持多平台的视频下载工具,涵盖 YouTube、Facebook、Instagram、TikTok、Twitter 等主流社交媒体,内置硬件加速下载和视频压缩功能,提升下载效率并节省存储空间。 |
OpenStock |
github.com/Open-Dev-Society/OpenStock |
一个开源的股票数据分析平台,提供实时股价追踪、个性化提醒功能,集成 TradingView 图表与 Finnhub 数据源,无需付费即可获取专业级市场数据,助力用户进行理性投资决策。 |
Computer Use Preview |
github.com/google/computer-use-preview |
谷歌推出的浏览器自动化工具,旨在实现 AI 对计算机操作的智能控制,支持在浏览器环境中执行自动化任务,适用于测试、数据采集和智能代理开发等场景。 |
xiaoju-survey |
https://github.com/didi/xiaoju-survey |
滴滴开源的企业级问卷调研系统,提供完整的功能模块,支持快速搭建私有化问卷平台,适用于内部调研、用户反馈收集等场景,具备高可扩展性和稳定性。 |
Logics-Parsing |
github.com/alibaba/Logics-Parsing |
阿里巴巴开源的文档解析工具,可将复杂文档精准转换为结构化 HTML,支持科学公式、化学结构的识别,并自动过滤页眉页脚等非核心内容,专注于高质量信息提取。 |
AIO Sandbox |
github.com/agent-infra/sandbox |
一个为 AI Agent 应用开发设计的统一沙箱环境,将浏览器、终端、文件系统、VSCode 和 Jupyter 等工具集成于单个 Docker 容器中,支持开箱即用,便于安全、高效地开发与测试 AI 代理任务。 |
Arya |
github.com/nicejade/markdown-online-editor |
一款功能全面的开源在线 Markdown 编辑器,支持绘制流程图、甘特图、时序图、Echarts 图表及五线谱,提供 PPT 预览和 HTML 转换功能,内容本地存储保障隐私,支持导出为 PDF、PNG、JPEG 等多种格式。 |
PandocX |
github.com/djyde/PandocX |
一款为Pandoc提供的开源可视化工具,支持多种主流文档格式之间的相互转换,界面简洁易用,可自动安装Pandoc及其依赖,大幅简化配置流程,提升文档转换效率。 |
Waifu2x-Extension-GUI |
github.com/AaronFeng753/Waifu2x-Extension-GUI |
一款支持图片放大和视频插帧的开源工具,基于 AI 实现超分辨率和帧率提升,支持 NVIDIA、AMD 显卡及 Intel 集显(性能适配不同),可在消费级硬件如 RTX 3060 上流畅运行。 |
nginx ignition |
github.com/lucasdillmann/nginx-ignition |
一个开源的 Nginx 可视化配置工具,通过浏览器界面即可轻松管理虚拟主机、SSL 证书、反向代理和自定义域名等配置,降低 Nginx 使用门槛,提升配置效率。 |
FlyCut Caption |
github.com/x007xyz/flycut-caption |
基于 Whisper 模型的视频字幕生成工具,支持高精度语音识别、字幕可视化编辑以及基础视频剪辑功能,适用于快速制作和编辑视频字幕。 |
Media Downloader |
github.com/mhogomchungu/media-downloader |
一款功能强大的多平台媒体下载工具,提供直观的图形界面,支持无限制并发和批量视频下载,具备高效的任务管理能力,并兼容中文、英文等多种语言界面。 |
Agora Flat |
github.com/netless-io/flat |
一套完整的在线教学解决方案,整合多功能互动白板、高质量音视频通话、课堂录制回放、云端课件存储及周期性课程安排等功能,适用于远程教学和协作场景。 |
sj.h |
github.com/rxi/sj.h |
一个极简的开源 JSON 解析库,仅用 150 行 C99 代码实现,采用零内存分配设计,具备超轻量级、高性能的特点,支持精确到行列的错误定位,可完全控制数据解析过程,适用于资源受限或对性能要求较高的场景。 |
蛐蛐 (QuQu) |
github.com/yan5xu/ququ |
免费的中文语音输入工具,可作为 Wispr Flow 的开源平替,使用阿里 FunASR 模型,完全在本地运行,支持精准中文语音识别,并可通过 AI 自动过滤口头禅、修正错误表述,以及根据当前应用智能调整输出格式。 |
Lucy Edit |
https://github.com/DecartAI/Lucy-Edit-ComfyUI |
一个基于 ComfyUI 的强大视频编辑工作流,支持服装更换、角色替换、物体插入和场景变换等多种高级视频编辑功能,通过可视化节点流程实现复杂的视频内容创作与修改,降低专业级视频编辑的技术门槛。 |
OrionTV |
github.com/orion-lib/OrionTV |
专为电视打造的开源视频播放器,支持 Apple TV 和 Android TV,基于 Expo + React Native TVOS 开发,针对电视遥控器交互进行 UI 优化,提供流畅的播放体验。 |
OBS-Zoom-To-Mouse |
github.com/BlankSourceCode/obs-zoom-to-mouse |
一款开源的OBS插件,可实现鼠标位置智能缩放功能,支持一键缩放、自动跟随鼠标移动并避免画面抖动,适用于录制视频教程时突出操作重点,兼容Windows、Linux和macOS平台。 |
OpenDataLoader PDF |
github.com/opendataloader-project/opendataloader-pdf |
一款专为AI应用场景设计的开源PDF处理工具,能够保留文档原始布局结构并支持输出为JSON、Markdown和HTML格式,内置AI安全过滤机制自动识别潜在威胁,支持多种编程语言且完全本地化运行保护隐私。 |
Hacker News 播客工具 |
github.com/ccbikai/hacker-news |
一个开源的Hacker News播客生成工具,每日自动抓取热门文章,通过AI生成中文摘要并转换为语音,支持网页、播客App收听及RSS订阅,可部署在Cloudflare或通过Demo体验。 |
How to Fix Your Context |
https://github.com/langchain-ai/how_to_fix_your_context |
LangChain 团队推出的开源教程项目,系统性地提供了 6 种解决大模型上下文过载问题的方案,包括 RAG 检索增强、工具动态加载、上下文隔离、修剪、摘要与卸载,基于 LangGraph 实现,每种方法均附带详细代码示例与性能对比,帮助开发者在复杂场景下维持 AI 应用的高质量输出。 |
Cook |
https://github.com/YunYouJun/cook |
一个开源的前端菜谱推荐工具,可根据用户选择的现有食材和厨具智能匹配可制作的菜肴,支持随机推荐、移动端适配与 PWA 安装,所有菜谱链接直达 B 站教学视频,提供流畅的原生级使用体验,支持在线访问或 Docker 本地部署。 |
ticket-purchase |
https://github.com/WECENG/ticket-purchase |
一个基于 Selenium 实现的大麦网自动抢票开源脚本,可模拟真实用户登录和购票流程,支持自定义选择观演人员、城市、场次日期、票价等条件,实现高效、无延时的自动化抢票。 |
RAGHub |
https://github.com/Andrew-Jang/RAGHub |
一个全面且持续更新的开源 RAG(检索增强生成)学习资源合集,涵盖主流框架、评估优化工具、RAG 引擎、数据处理库、实用项目案例及模型排行榜,每个项目均标注活跃状态与 GitHub Star 数,帮助 AI 开发者高效构建和优化 RAG 应用。 |
KoboldCpp |
https://github.com/LostRuins/koboldcpp |
一款基于 llama.cpp 构建的开源大模型运行工具,兼具高效推理与易用性,支持 CPU/GPU 加速,提供 OpenAI 和 Ollama 兼容 API。集成图像生成、语音识别、TTS 等多功能于单个可执行文件,开箱即用,支持 Windows、macOS、Linux 全平台部署。 |
FluentRead |
https://github.com/Bistutu/FluentRead |
一款开源的浏览器翻译插件,支持双语对照、划词翻译和全文翻译,提供丰富的自定义选项与快捷键操作,兼容 Google、DeepL、OpenAI、Kimi、DeepSeek、Ollama 等 20 多种翻译服务,可在 Chrome、Edge、Firefox 上安装使用,助力用户实现母语般的沉浸式网页阅读体验。 |
Extractous |
https://github.com/yobix-ai/extractous |
一款高效的开源文档解析工具,支持从 PDF、Word、Excel、PowerPoint 等多种格式及图片(通过 OCR)中提取文本内容,并转换为结构化的 Markdown 格式。具备低内存占用、处理速度快(比 unstructured-io 快 25 倍)等优势,提供简洁 API,适用于知识库构建与大模型训练场景。 |
Claude Code 高级使用指南 |
https://github.com/Cranot/claude-code-guide |
一份全面开源的 Claude Code 使用指南,涵盖基础操作到高级自动化实践,包括多系统协同、后台任务监控、自定义命令、Hook 系统、MCP 集成、智能上下文管理与任务队列优化等内容,为开发者提供从入门到高阶的完整进阶路径。 |
洛云 (Luoyun) |
https://github.com/PeterZhao119/luoyun_project |
一个基于微信的开源 AI 虚拟人框架,支持多模态交互(文本、语音、图片)、记忆体管理、日常行为模拟与朋友圈自动发布。具备好感度系统、知识学习、异步状态模拟等拟人化特性,通过解耦通信与算法实现类人聊天体验,适用于社交陪伴、角色扮演等场景,需注意使用风险并遵守微信平台规范。 |
ArduPilot |
https://github.com/ArduPilot/ardupilot |
一个功能强大且高度成熟的开源自动驾驶项目,支持飞机、四旋翼、多旋翼、直升机、漫游车、帆船、水下航行器、潜艇、平衡机器人等多种载具,提供完整的飞行控制、导航与任务规划能力,具备高度可扩展性,广泛应用于科研、教育和工业领域。 |
TrendPublish |
https://github.com/OpenAISpace/ai-trend-publish |
一个开源的 AI 内容自动化工具,可全自动抓取 Twitter 和网站热点,利用 Deepseek、通义、讯飞等大模型进行智能分析与内容生成,支持自动排版、定时发布,帮助用户快速搭建个人 AI 内容中心,实现高效的内容创作与运营。 |
Vicinae |
https://github.com/vicinaehq/vicinae |
一款基于 C++ 和 Qt 开发的高性能跨平台原生桌面启动器,支持 macOS 和 Linux,兼容 Raycast 扩展 API。具备快速应用启动、百万级文件全文搜索、加密剪贴板历史追踪、智能表情选择、内置计算器和动态快捷方式等强大功能,帮助用户高效完成日常桌面操作,提升生产力。 |
Overleaf-Bib-Helper |
https://github.com/Arvid-pku/Overleaf-Bib-Helper |
一个开源的油猴脚本插件,可在 Overleaf 编辑器内直接搜索 DBLP 和 Google Scholar 的学术文献,一键获取并插入标准 BibTeX 引用,支持标题、作者或关键词搜索,自动处理特殊字符,支持批量导入,显著提升论文写作中参考文献管理的效率。 |
chsrc |
https://github.com/RubyMetric/chsrc |
一个开源的全平台通用源切换工具与框架,支持 Linux、Windows、macOS、BSD 等系统,内置 60+ 镜像源地址,仅需一行命令即可自动切换至可用源。提供测速选源、项目级换源等功能,有效提升软件包下载速度,解决网络受限问题。 |
Terminator |
https://github.com/mediar-ai/terminator |
一款创新的开源自动化 AI 工具,摒弃传统 OCR 方式,通过直接解析应用程序的界面结构(类似 HTML)来实现对桌面软件的精准控制。具备极高速度、可在后台或遮挡状态下操作、稳定性强等优势,显著优于传统自动化方案,目前主要支持 Windows 系统。 |
LoFi Engine |
https://github.com/meel-hd/lofi-engine |
一款开源的跨平台桌面应用,可程序化生成独特的 LoFi 音乐,支持自定义环境音效(如雨声、海浪)、视觉主题和音乐效果,提供全键盘快捷操作,无需联网即可本地运行,帮助用户在学习或工作中沉浸于专注氛围。 |
Stremio |
https://github.com/Stremio/stremio-web |
一个开源的跨平台媒体中心,通过插件化架构整合各类视频资源,支持统一的内容发现、播放列表管理与观看进度追踪,提供简洁流畅的 Web 界面,可在浏览器中直接使用,也可通过 Docker 部署或本地运行,帮助用户集中管理分散的影视内容。 |
Pixelle MCP |
https://github.com/AIDC-AI/Pixelle-MCP |
阿里团队开源的 MCP 协议工具,可将 ComfyUI 工作流零代码转换为 AI 助手可调用的标准化工具,支持文本、图像、音频、视频全模态内容生成与互转,无缝集成 Cursor、Claude Desktop 等 MCP 客户端,内置 Web 聊天界面,支持主流大模型,可通过 Docker 一键部署。 |
Diff Excel |
https://github.com/zbuzhi/diff-excel |
一款开源的 Excel 文件对比工具,支持上传两个文件并自动识别内容差异,通过颜色高亮显示变化,保留原始格式与合并单元格,支持多 Sheet 同时对比,并可在单元格中添加备注查看原始值,支持自定义高亮颜色,适用于 Windows、macOS 和 Linux 系统,提升数据核对效率。 |
Web-Dev-Resources |
https://github.com/WebdevShefali/Web-Dev-Resources |
一份精心整理的 Web 开发资源合集,涵盖免费 API、设计资源(颜色、字体、图标、矢量图库)、CSS 生成器、前端框架与组件、学习平台及免费托管服务等十余个分类,内容全面且实用,适合 Web 开发者尤其是初学者收藏查阅。 |
agentUniverse |
https://github.com/agentuniverse-ai/agentUniverse |
蚂蚁集团基于真实金融业务场景抽象出的开源智能体(Agent)框架,非实验性项目,具备高可用性与工程实践价值。提供模块化架构,支持快速构建和部署 AI 智能体应用,涵盖任务调度、记忆管理、工具集成等核心能力,适合开发者直接用于业务开发或参考大厂在复杂系统中的设计思路与避坑经验。 |
AutoAgent |
https://github.com/HKUDS/AutoAgent |
一个面向技术小白的开源 LLM 智能体(Agent)开发工具,支持通过自然语言零代码创建功能完整的智能体。内置 Agentic-RAG 和自管理向量数据库,兼容 OpenAI、Claude、DeepSeek 等主流模型,提供用户模式、智能体编辑器与工作流编辑器三种交互方式,在 GAIA 基准测试中表现优异,支持函数调用与 ReAct 模式,降低 Agent 应用开发门槛。 |
iOS OCR Server |
https://github.com/riddleling/iOS-OCR-Server |
一个开源的本地 OCR 解决方案,将 iPhone 变身为私有化 OCR 服务器。基于苹果 Vision Framework 实现高精度、多语言文字识别,支持网页上传和 JSON API 调用,100% 数据本地处理,无需联网,保障隐私安全,并可返回文字位置信息用于绘制边界框,适用于对隐私敏感的图像文字提取场景。 |
Awesome-RAG |
https://github.com/liunian-Jay/Awesome-RAG |
一份精心整理的 RAG(检索增强生成)学习资源合集,按时间线和顶级会议(如 NeurIPS、EMNLP、ACL、ICML、ICLR)分类,收录2024至2025年最新研究论文、评估数据集(如 HotpotQA、NaturalQuestions)及实用工具,系统梳理 RAG 技术发展脉络,持续更新前沿动态与开源项目,是深入学习和研究 RAG 技术的优质参考资料。 |
claude-init |
https://github.com/cfrs2005/claude-init |
一个专为国内开发者打造的 Claude Code 中文开发套件,提供从安装、配置到 AI 指令的全流程中文本地化体验。集成智能上下文管理、MCP 服务器、Gemini 深度咨询、Context7 文档查询、自动化 Hook 脚本与安全扫描等功能,支持中文项目模板、跨会话状态管理及自定义音效,通过一键脚本快速部署,降低中文用户使用 Claude Code 的门槛。 |
STORM |
https://storm.genie.stanford.edu / GitHub |
斯坦福大学开源的 AI 研究报告生成工具,能根据用户输入的研究主题自动检索上百个网页,生成结构完整、事实准确率高达 99% 的高质量研究报告。报告包含目录、正文(带引用标注)和参考文献,并支持一键导出 PDF。提供在线使用版本和开源代码,显著提升资料搜集与学术写作效率。 |
Lid Angle Sensor |
https://github.com/samhenrigold/LidAngleSensor |
一个利用未公开 API 实现的趣味 macOS 工具,可实时检测并显示 MacBook 屏幕开合角度,同时播放逼真的木门开关音效。该项目展示了硬件传感器的创意应用,为开发者探索系统底层功能提供了有趣范例,适用于 M 系列芯片 MacBook,可通过 Xcode 编译运行。 |
GPU Glossary |
https://github.com/modal-labs/gpu-glossary |
一份面向机器学习工程师的深度性能优化指南,表面为 GPU 术语词典,实则构建了连接 ML 性能优化与底层硬件架构的知识体系。涵盖 GPU 硬件架构、CUDA 编程、内存瓶颈、Tensor Core 原理等核心技术,采用超链接知识图谱形式,结合 Modal 平台实战经验,专注于解决大模型训练与推理中的 GPU 利用率、内存带宽等实际性能问题,支持在线阅读与主题切换。 |
AI Video Transcriber |
https://github.com/wendy7756/AI-Video-Transcriber |
一款开源的智能视频转录与摘要工具,支持 YouTube、TikTok、B 站等 30 多个平台,可自动将视频语音高精度转为文字(支持 100+ 语言),利用 GPT-4o 进行智能纠错、断句和文本优化,并生成多语言内容摘要。提供实时进度追踪,跨平台使用且适配移动端,支持 Docker 一键部署和本地安装,需配置 OpenAI API 密钥。 |
Windows-Use |
https://github.com/CursorTouch/Windows-Use |
一个强大的开源项目,使大语言模型能够直接控制和操作 Windows 系统(支持 Windows 7–11),实现应用启动、界面点击、文本输入等系统级自动化任务。通过深层 API 集成实时捕获和理解 GUI 状态,智能决策后续操作,无需依赖传统计算机视觉或 OCR 技术,支持语音指令输入,真正实现“动嘴控制电脑”的 AI 自动化体验。 |
AIstudioProxyAPI |
https://github.com/CJackHwang/AIstudioProxyAPI |
一个基于 Python 的代理服务器项目,通过 Camoufox(反指纹 Firefox)和 Playwright 自动化技术,将 Google AI Studio 的网页服务封装为兼容 OpenAI 格式的 API(支持 /v1/chat/completions )。支持流式响应、智能模型切换、完整参数控制(如 temperature、max_tokens 等),并集成反指纹检测、脚本注入、现代化 Web 测试界面与 GUI 启动器,提供分级 API 密钥管理和模块化架构,便于二次开发与部署,实现对热门模型的“套壳”调用与商业化 API 服务。 |
The Little Book of Linear Algebra |
https://github.com/the-litte-book-of/linear-algebra |
一本通俗易懂的线性代数入门开源书籍,采用循序渐进的方式讲解向量、矩阵、线性变换、特征值分解等核心概念,内容涵盖向量空间、矩阵运算、线性方程组、谱定理及在计算机图形学、数据科学和机器学习中的实际应用。每章配有丰富例题与练习,支持 PDF、EPUB 和 LaTeX 格式下载,适合初学者系统学习与巩固基础。 |
Beszel |
https://github.com/henrygd/beszel |
一款轻量级开源服务器监控工具,支持在统一 Web 界面中实时查看多台服务器的 CPU、内存、磁盘、温度等系统指标及 Docker 容器的资源使用情况。具备历史数据记录、可配置告警(支持 CPU、内存、磁盘等)、多用户管理、OAuth 第三方认证、自动备份至本地或 S3 兼容存储等功能,部署简单,资源占用低,可通过 Docker 快速启动。 |
Structured Prompt Builder |
https://github.com/Siddhesh2377/structured-prompt-builder |
一个开源的可视化提示词构建工具,支持通过结构化字段(如角色、任务、受众、风格、约束等)创建高质量 Prompt,并实时预览 Markdown、JSON、YAML 三种格式,支持一键复制、下载与分享。提供本地提示词库管理、AI 辅助优化(如 Gemini)、模型参数调节及 JSON 导入导出功能,基于 React 18 构建,可在浏览器中本地运行,提升提示工程效率。 |
Fireplexity |
https://github.com/firecrawl/fireplexity |
一个开源的高速 AI 搜索引擎,被誉为“Perplexity 开源版”,基于 Firecrawl 实时抓取网页数据,结合 Groq 大模型 API 提供流式响应与权威引用。支持多模态搜索,涵盖网页、新闻和图片内容,具备实时性与高可信度。采用 Next.js 构建,支持本地部署(需配置 Firecrawl 和 Groq API Key),技术栈以 TypeScript 为主,遵循 MIT 开源协议,已获 1.2k Stars,社区活跃。 |
Claudable |
https://github.com/opactorai/Claudable |
一个强大的 AI 编程助手,专为快速构建 Web 应用而设计。通过集成 Claude Code、Gemini CLI、Qwen Coder、Cursor 等主流本地 CLI 编程 Agent,支持使用自然语言描述想法,即可自动生成完整的生产级 Next.js 应用。提供实时预览、自动错误检测与修复、Supabase 数据库集成(含用户认证),并支持一键部署至 Vercel。目前需本地安装使用,适合追求高效开发的全栈开发者。 |
CodeForge |
https://github.com/devlive-community/codeforge |
一款轻量级开源桌面代码执行器,支持 Python、JavaScript、Rust、Go、C/C++ 等 20 多种主流编程语言的一键即时运行。提供带语法高亮和自动缩进的简洁编辑器,实时显示执行结果与耗时,具备插件化架构便于扩展,无需联网即可使用。适用于技术分享、教学演示或快速验证代码片段,支持 Windows 和 macOS,提供开箱即用安装包。 |
SparkyFitness |
https://github.com/CodeWithCJ/SparkyFitness |
一款可自托管的开源健身管理工具,提供营养追踪、运动记录、身体测量、每日打卡等全方位健康管理功能。集成 AI 营养教练,支持通过聊天方式记录饮食与运动,并可通过上传食物图片自动识别餐食内容。支持生成营养摄入与身体数据的趋势报告(按周/月查看),保护用户隐私,支持家庭成员共享使用,可通过 Docker 一键部署。 |
LunarBar |
https://github.com/LunarBar-app/LunarBar |
一款开源免费的 macOS 状态栏极简日历应用,支持在菜单栏显示公历与农历日期,并提供公共假日提醒功能。与系统日历和提醒事项无缝集成,界面设计简洁美观,不干扰日常使用。具备自动更新机制,保障应用始终为最新版本,完全本地运行且无数据收集,保护用户隐私。支持通过 dmg 安装包或 Homebrew 安装,轻量实用。 |
Termix |
https://github.com/LukeGus/Termix |
一个开源免费的自托管服务器管理平台,提供统一的 Web 界面来集中管理多台服务器。支持 SSH 终端(含分屏与标签)、远程文件编辑(带语法高亮)、SSH 隧道管理(支持自动重连与健康监控)、主机信息分类存储,以及实时 CPU、内存、硬盘等系统状态监控。内置用户认证系统,支持管理员权限控制和 OIDC 单点登录,可通过 Docker Compose 一键部署,简化运维操作。 |
File Transfer Go |
https://github.com/MatrixSeven/file-transfer-go |
一个开源的点对点文件传输工具,基于 WebRTC 技术实现设备间高速、安全的直连传输,数据端到端加密且不经过服务器中转,保障隐私。支持多文件批量传输、大文件快速发送、6 位取件码分享文本内容以及实时桌面共享功能。支持 Docker 一键部署或本地构建,界面响应式设计,兼容手机、平板和电脑,无需登录即可使用。 |
F2 |
https://github.com/Johnserf-Seed/f2 |
一个功能强大的开源 Python 工具库,支持从抖音、TikTok、Twitter 等多个平台批量下载视频、图片、音频等内容。提供直播流录制、实时弹幕采集、用户主页作品及互动数据批量获取等功能,支持命令行(CLI)和编程 API 两种使用方式。具备 Cookie 管理、自定义配置、内置数据库存储与文件管理能力,便于绕过平台限制并高效整理数据,通过 pip 安装后即可快速使用。 |
Dataset Viewer |
https://github.com/stardustai/dataset-viewer |
一款开源的轻量级高性能数据查看工具,基于 Tauri + React 构建,支持秒级打开 100GB 以上的超大 Parquet、CSV、Excel 等格式文件。采用虚拟化渲染技术实现流畅浏览,提供毫秒级实时搜索、高亮定位、压缩包(ZIP/TAR)流式预览功能,并支持 WebDAV、云存储及 HuggingFace 数据集等多源接入。界面简洁,支持深色/浅色主题与多语言,适用于 Windows、macOS 和 Linux 系统,无需加载全部数据即可高效查看与探索大规模数据集。 |
Interactive Feedback MCP |
https://github.com/noopstudios/interactive-feedback-mcp |
一个开源的 MCP 服务器,用于增强 AI 编程工具(如 Cursor、Cline、Windsurf)的交互安全性。在 AI 执行命令前后插入人工确认环节,避免无脑执行无效或高成本操作,有效减少不必要的 API 调用和开发开销。支持项目级配置保存、常用命令记忆、实时命令输出反馈与交互式审批流程,在提升开发质量的同时增加控制粒度,适合对 AI 输出需严格把关的开发者使用。 |
VibeVoice |
https://github.com/microsoft/VibeVoice |
微软开源的高性能文本转语音(TTS)模型,支持生成长达 90 分钟的连续自然语音,适用于播客、有声书等长内容创作。支持最多 4 个不同说话人之间的流畅对话,可智能添加背景音乐与音效以增强沉浸感,具备中英文跨语言合成和基础歌唱能力(自动为歌词生成旋律)。提供 1.5B 和 7B 两种模型版本,兼顾效果与部署效率,支持 Docker 快速部署,并附带 Gradio 可视化界面,便于交互式使用。 |
Osaurus |
https://github.com/dinoki-ai/osaurus |
一款专为 Apple Silicon 深度优化的本地大语言模型(LLM)服务器,基于苹果原生 MLX 框架构建,在流式输出速度和多轮对话性能上超越 Ollama。支持通过 KV 缓存实现会话复用,显著提升响应效率。提供原生 SwiftUI 图形界面,告别命令行操作,集成可视化模型管理、实时 CPU/内存监控,并完全兼容 OpenAI API(支持函数调用)。可通过 Xcode 构建或下载预编译版本使用,充分发挥 M 系列芯片的本地 AI 推理潜力。 |
MarkFlowy |
https://github.com/drl990114/MarkFlowy |
一款开源的轻量级 Markdown 编辑器,基于 Tauri 框架开发,安装包小于 10MB,支持 macOS、Windows 和 Linux。内置 AI 助手,可调用 DeepSeek、ChatGPT 等大模型实现一键翻译、文章摘要、对话润色与内容导出。支持源码模式与所见即所得(WYSIWYG)双编辑模式,提供自定义主题系统和基于 Remirror 的高扩展性编辑核心,兼顾简洁性与功能性,适合专注写作与高效笔记的用户。项目持续迭代中,可自由下载体验。 |
awesome-hacker-search-engines |
https://github.com/edoardottt/awesome-hacker-search-engines |
一个全面的开源黑客与安全领域搜索引擎合集,汇总超过 500 个专业搜索工具,涵盖漏洞利用数据库、服务器信息、攻击面发现、DNS/SSL 证书查询、威胁情报、泄露数据、OSINT(如邮箱、手机号、社交网络)、文件与图像搜索、区块链分析等 20 多个分类。适用于渗透测试、红队攻防、漏洞研究和安全分析,是安全从业者和研究人员的实用资源库,支持持续更新与贡献。 |
Local PDF Tools |
https://github.com/krmanik/local-pdf-tools |
一款开源的本地化 PDF 处理工具,支持在浏览器中完全离线操作,确保文件隐私安全。提供 PDF 压缩(多种质量预设)、多文件合并、按页码拆分等常用功能,所有处理均在本地完成,无需上传文件。采用 WebWorker 技术保障大文件处理流畅性,支持暗色模式与简洁直观的界面,通过 npm 本地运行或自行部署,适合处理含敏感信息的 PDF 文档。 |
The Mechanics of Machine Learning |
https://mlbook.explained.ai |
一本专为程序员编写的机器学习入门书籍,作者 Jeremy 前连续两年 Kaggle 竞赛冠军。全书以直白语言和大量实战代码,系统讲解机器学习核心原理与工作流程,涵盖数据探索、清洗、特征工程、模型训练与验证等完整环节。重点介绍随机森林回归与分类器实现,并通过纽约公寓租金预测等真实项目案例,深入演示 NumPy、Pandas 等工具的实际应用。内容注重实践,适合希望快速掌握 ML 实战技能的开发者,目前可免费在线阅读。 |
生成式 AI 学习指南 |
https://github.com/genieincodebottle/generative-ai/blob/main/GenAI_Roadmap.md |
一份系统性的生成式 AI 学习路线图,涵盖 6 个阶段共 12 周的学习计划,从基础概念到模型部署(LLMOps)全流程。内容包括 Transformer、RAG、Agentic AI 等核心技术,集成 LangChain、CrewAI 等主流框架,提供大量实战代码(如聊天机器人、PDF 解析)、视频教程、研究论文、行业白皮书及面试题库,适合希望体系化掌握生成式 AI 的学习者。 |
Browser Use 0.6.0 |
https://github.com/browser-use/browser-use |
Browser Use 发布 0.6.0 版本,正式告别 Playwright,全面转向原生 Chrome DevTools Protocol (CDP)。新架构消除异步阻塞与多进程死锁问题,显著提升性能与稳定性,降低资源占用和检测风险,增强反爬绕过能力。保持 Playwright API 兼容性,支持 Chromium 系列浏览器(如 Brave、Edge),并强化自动恢复机制。未来将分享技术迁移深度解析,推动高效稳定的 Web 自动化生态发展。 |
Open Avatar Chat |
https://github.com/HumanAIGC-Engineering/OpenAvatarChat |
一个开源的低延迟数字人对话系统,可在个人电脑上本地运行,平均响应时间仅 2.2 秒。支持文本、音频、视频等多模态交互,采用模块化架构设计,预置 100+ 数字人形象,支持 LiteAvatar 和 LAM 两种渲染方式。提供前后端分离结构,便于自定义界面与功能扩展,支持本地推理和云端 API 两种部署模式,并可通过 Docker 一键快速部署,适合快速搭建数字人应用的开发者使用。 |
Motia |
https://github.com/MotiaDev/motia |
一个统一的后端开发框架,将 API 服务、任务队列(如 BullMQ)和 AI Agent(如 LangChain)整合为单一系统,所有功能单元均以“Step”组织,实现开箱即用。支持 JavaScript、TypeScript 和 Python 多语言混合开发,内置可观测性工具(日志、Trace、状态可视化),采用事件驱动架构,支持复杂工作流与容错处理。提供可视化工作台、热重载和一键部署能力,通过 npx motia create 快速初始化项目,简化全栈与 AI 应用开发流程。 |
Project AIRI |
https://github.com/moeru-ai/airi |
一个开源的 AI 虚拟伴侣项目,可构建具有个性的赛博生命,支持 Live2D 和 VRM 虚拟形象,具备自动眨眼与表情动画,带来生动的视觉体验。集成语音识别与合成技术,支持自然语音对话,并兼容 OpenAI、Claude 及多种国产大模型。不仅能作为桌宠陪伴,还可作为 AI 伙伴在 Minecraft、Factorio 等游戏中协同游玩。支持 Discord、Telegram 等平台聊天集成,基于 Web 技术实现跨平台运行,可通过 pnpm dev 本地启动或访问在线 Demo 体验。 |
FossFLOW |
https://github.com/stan-smith/FossFLOW |
一个开源的等距图表绘制工具,专为制作 3D 风格技术架构图设计,界面简洁易用,降低非专业用户上手门槛。内置丰富等距组件库,支持 PNG、JPG、SVG 格式图标导入与自动缩放,提供自动保存、快捷键配置和多种存储方式。支持 PWA 离线使用,可安装为本地应用,所有数据本地存储保障隐私;同时支持 Docker 一键部署,便于团队共享与多设备访问。可通过在线 Demo 体验或自行部署使用。 |
MaxKB |
https://github.com/1Panel-dev/MaxKB |
一款基于大语言模型(LLM)的开源智能问答系统,被誉为企业的“最强大脑”,拥有 3.1k+ Star。支持直接上传文档或自动爬取在线内容,具备文本自动拆分与向量化能力,实现高效知识检索。提供直观的智能问答交互体验,支持零编码集成到第三方业务系统。兼容主流大模型如 Llama 2/3、通义千问、OpenAI、Azure OpenAI、Kimi、百度千帆等,具备高度灵活性和扩展性,适用于企业级知识库构建与智能客服场景。 |
Trafilatura |
https://github.com/adbar/trafilatura |
一个功能强大的 Python 软件包和命令行工具,专注于从原始 HTML 中提取主要文本、元数据和评论,简化网络文本采集与结构化处理流程。支持网页抓取、下载与内容发现,有效去除页眉、页脚等重复干扰元素,在提取精度与召回率之间取得良好平衡。无需数据库依赖,输出可转换为多种常用格式,具备高可靠性与合理处理速度,被 HuggingFace、IBM、Microsoft Research、艾伦研究所、斯坦福大学等数千个项目和机构广泛采用。 |
SingleFile |
https://github.com/gildas-lormeau/SingleFile |
一个强大的网页归档工具,可将整个网页(包括 HTML、CSS、JavaScript、图片等资源)保存为单个自包含的 HTML 文件,便于离线查看与长期保存。支持 Chrome、Firefox、Edge、Safari、Brave 等主流浏览器的扩展版本,并提供命令行工具用于自动化操作,兼容桌面与移动设备,是网页快照、知识存档和内容备份的理想选择。 |
AIMangaStudio |
https://github.com/morsoli/aimangastudio |
一个基于 AI 的端到端漫画创作工具,专为独立创作者和工作室设计,集成剧情生成、分镜布局、角色设定与页间连续性分析等功能,支持从文本脚本自动生成漫画页面。提供角色风格控制与视觉一致性优化,简化漫画制作流程,提升创作效率,降低艺术创作门槛,助力用户快速实现从创意到成稿的完整创作闭环。 |
Cypht |
https://github.com/cypht-org/cypht |
一个开源的电子邮件聚合工具,支持 IMAP/SMTP、JMAP 和 EWS 协议,可将来自多个邮箱账户的邮件统一集中到一个界面中管理,无需替换现有账户。设计灵感类似新闻阅读器,提供简洁高效的信息流体验,同时兼具新闻阅读功能,帮助用户在一个地方高效浏览和管理所有电子邮件与订阅内容。 |
Crawlee |
https://github.com/apify/crawlee |
一个强大且高效的端到端网页爬取与数据抓取工具库,专为构建可靠、反检测的爬虫而设计。即使使用默认配置,也能模拟人类行为,有效绕过现代反爬机制(如验证码、IP封锁等)。支持自动发现链接、渲染动态内容、管理请求队列,并提供便捷的数据存储选项(本地磁盘或云存储)。高度可配置,适用于从简单抓取到复杂大规模爬虫项目的各种需求,显著提升开发效率与爬取成功率。 |
BrowserOS |
https://github.com/browseros-ai/BrowserOS |
一款开源的 AI Agent 浏览器,基于 Chromium 构建,旨在通过本地运行的 AI 智能体彻底革新浏览体验。支持自然语言指令驱动浏览器自动完成复杂任务(如网购下单),内置本地 AI 聊天功能,可引用当前网页内容进行问答,并支持并排运行多个 LLM 进行答案对比。具备标签页智能管理、MCP 商店扩展等生产力特性,强调隐私安全,AI 模型可运行在本地(如通过 Ollama),避免数据上传。界面与 Chrome 高度一致,支持导入 Chrome 数据,便于用户迁移使用。 |
MCP 注册中心 |
https://github.com/modelcontextprotocol/registry |
一个为 MCP(Model Context Protocol)客户端提供集中化服务发现的开源平台,可视为 MCP 服务器的“应用商店”。它允许开发者发布和管理自己的 MCP 服务器,供其他用户发现和集成。项目包含 mcp-publisher 命令行工具,简化发布流程,并通过严格的命名空间验证机制,确保只有合法所有者才能发布对应服务,保障生态的安全性与可信度。该注册中心推动 MCP 生态的标准化与可扩展性,促进 AI 功能模块的共享与复用。 |
Real-Time Voice Cloning |
https://github.com/CorentinJ/Real-Time-Voice-Cloning |
一款广受欢迎的开源语音克隆项目,已获得 57K+ Star,能够基于少量语音样本快速克隆人声并生成任意内容的语音。底层采用 SV2TTS 深度学习架构和 WaveRNN 声码器,兼顾生成质量与效率。提供图形化工具箱,支持在 Windows 和 Linux 系统运行,安装 ffmpeg 和 Python 环境后即可使用,若有 NVIDIA 显卡可显著提升处理速度。尽管项目流行度高,但其克隆效果并非当前最优,适合对实时性和易用性有要求的实验与开发场景。 |
uutils coreutils |
https://github.com/uutils/coreutils |
一个使用 Rust 语言重写的 GNU coreutils 工具集,旨在提供跨平台的一致性体验。无论在 Windows、macOS 还是 Linux 系统上,都能运行完全相同的行为和接口的命令行工具(如 ls 、cp 、rm 等),解决了传统 GNU 工具在不同系统间行为差异的问题。性能优异,安全性高,易于编译和部署,是构建可移植脚本和跨平台自动化任务的理想选择。 |
Chatterbox |
https://github.com/resemble-ai/chatterbox |
一个开源的高质量文本转语音(TTS)模型,支持中文、英文、日文等 23 种语言,具备自然流畅的语音合成能力。支持通过调节参数控制语调、情感强度和表现力,并实现零样本语音克隆——仅需一段参考音频即可模仿声音特征。内置音频水印功能,防止滥用。提供在线 Demo 页面,便于体验多种语音效果,适用于视频制作、游戏开发、语音助手等场景,是功能强大且注重安全的多语言 TTS 解决方案。 |
GenKit |
https://github.com/firebase/genkit |
一个由 Google 开源的 AI 应用开发框架,已在生产环境中实际应用,具备高稳定性与实用性。专为全栈 AI 应用设计,支持文本生成、对话机器人、自动化任务、推荐系统等场景,仅需几行代码即可集成多模态处理、结构化输出生成、工具调用和智能工作流构建。提供本地 CLI 和图形化开发者界面,支持提示词测试、执行流程调试及多模型输出对比,显著提升 AI 功能的开发与迭代效率。 |
OpenPI |
https://github.com/Physical-Intelligence/openpi |
一个开源机器人项目,集成了多种视觉-语言-动作(Vision-Language-Action)模型,旨在实现机器人通过自然语言指令理解任务并执行物理操作。支持开箱即用的直接推理,也允许开发者使用自有数据进行模型微调,以适配特定场景。项目推动物理智能(Physical Intelligence)的发展,为机器人控制提供灵活、可扩展的 AI 解决方案,适用于服务机器人、工业自动化等研究与应用领域。 |
RAGFlow |
https://github.com/infiniflow/ragflow |
一个获得 60K+ Star 的开源 RAG(检索增强生成)引擎,旨在让 AI 大模型基于企业或个人知识库生成准确、可溯源的答案。支持 Word、PPT、Excel、PDF(含扫描件)、图片、网页等多种复杂文档格式的深度理解与结构化提取,通过智能切分和优化索引,实现高效信息检索。提供完整的 RAG 工作流,支持对接主流大语言模型(如 GPT-4o、文心一言、DeepSeek 等)和向量模型,输出答案时附带原文引用并支持点击溯源,显著降低“幻觉”。采用 Docker 一键部署,硬件要求适中,适合从个人到企业的各类知识库智能化场景。 |
wechatDownload |
https://github.com/qiye45/wechatDownload |
一个免费开源的微信公众号内容下载工具,支持一键批量下载指定公众号的全部文章、评论及合集内容。可将内容保存为网页、PDF、Word 或带图文的 Markdown 文档,完整保留原文中的图片、视频和音频文件,实现本地化归档。无需安装证书,兼容 Windows 和 Mac 系统,操作简单,适合用于知识收藏、内容备份与离线阅读。 |
AI 微信公众号自动化工具 |
https://github.com/iniwap/ai_auto_wxgzh |
一个专为微信公众号运营设计的开源自动化工具,基于 CrewAI 多角色协作框架和 AIPy 搜索扩展,实现从热点抓取、文章生成、排版优化到自动发布的全流程自动化。可实时抓取抖音、微博等平台热门话题,驱动多AI角色协作生成高质量内容,并支持一键套用排版模板。配置公众号账号信息后,可实现无人值守发布。提供可执行安装包,无需编程基础,普通用户也能轻松上手,大幅提升内容运营效率。 |
WeRSS |
https://github.com/rachelos/we-mp-rss |
一个开源的微信公众号 RSS 订阅生成工具,可自动抓取并解析指定公众号的最新文章,生成标准 RSS 订阅源,方便用户通过主流阅读器(如 Feedly、Inoreader)订阅。支持 Webhook 和 API 集成,便于与其他系统联动。提供友好的 Web 管理界面,支持定时更新、多数据库(SQLite/MySQL)、多平台通知(钉钉、微信、飞书机器人),并通过 Docker 镜像与 Compose 模板实现一键部署,配置灵活,适合个人和团队构建个性化的公众号内容聚合与推送系统。 |
MOSS-TTSD |
https://github.com/OpenMOSS/MOSS-TTSD |
由 OpenMOSS 团队开发的双语对话语音合成模型,可将中英文双人对话文本转换为自然、富有表现力的口语音频,专为 AI 播客等场景设计。基于统一语义-声学神经编解码器架构,结合大语言模型与海量语音数据训练,支持高质量语音生成、零样本音色克隆和长文本稳定输出。通过参考音频即可克隆两个不同说话人音色,并在对话中自动精准切换,实现逼真的双人对话效果,是构建多语言播客内容的高效工具。 |
Zen Browser |
https://github.com/zen-browser/desktop |
一个基于 Mozilla Firefox 构建的开源网页浏览器,已获得 34K+ Star,以轻量、快速、专注为核心理念。安装包仅约 70MB,启动速度快于 Chrome,支持 Windows、macOS 和 Linux 三大平台。兼容 Chrome 书签、密码及扩展插件,降低迁移成本。提供多个独立工作空间(如“工作”、“学习”),实现标签页完全隔离,支持快捷键快速切换,提升多任务管理效率。支持一键切换紧凑模式,界面简洁美观,注重用户隐私与沉浸式浏览体验,致力于为用户提供更专注、更平静的上网环境。 |
AFFiNE |
https://github.com/toeverything/AFFiNE |
一个开源、隐私优先、本地优先的全能知识管理与协作平台,被誉为 Notion 与 Miro 的开源替代。已获得 50K+ Star,集文档、白板、表格、幻灯片和数据库于一体,构建于统一的“自由画布”之上。支持在无限画布中自由排布富文本、便签、形状、嵌入网页、多视图数据库等模块,实现非线性思维与视觉化协作。提供文档与画布一键切换功能,融合线性写作与自由布局优势。数据默认本地存储,保障隐私,同时支持跨设备同步与实时协作。基于 Yjs、BlockSuite 等开源技术构建,是面向未来的“知识操作系统”。 |
EasySpider |
https://github.com/NaiboWang/EasySpider |
一款开源的可视化网页数据采集工具,彻底告别传统爬虫编程,通过图形化界面和鼠标操作即可完成复杂的数据抓取任务。支持自动识别网页元素、自动生成 XPath 或 CSS 选择器,内置循环翻页、数据提取、条件判断等逻辑配置,可轻松采集数千甚至上万条结构化数据(如房源标题、描述、经纪人信息等)。无需编程基础,小白用户几分钟即可上手,效率远超手工复制,是高效、易用的零代码爬虫解决方案。 |
Folo |
https://github.com/RSSNext/Folo |
一款开源、免费的信息聚合神器,被誉为“bug级”的个人互联网入口。通过订阅 RSS 源,自动聚合用户关注的 AI 大佬、技术博主、设计达人等在 GitHub、B站、博客等平台的最新动态,实现全网内容一站式浏览。支持 AI 增强功能,可自动将英文 AI 论文等复杂内容秒级翻译为中文,并在 3 秒内提炼核心要点,大幅提升信息获取效率。跨平台支持 Windows、macOS 和移动端,界面简洁,完全开源,是信息过载时代实现高效学习与认知升级的秘密武器。 |
Portainer |
https://github.com/portainer/portainer |
一款开源、免费的 Docker 和 Kubernetes 可视化管理工具,GitHub 上已获得 33K+ Star,广受开发者和运维人员青睐。支持本地 Docker 环境(通过 Socket 连接)和远程 Docker/K8s 集群的统一管理。部署后通过浏览器访问 9000 端口,创建管理员账户即可使用。提供清晰直观的 Web 界面,实时展示容器、镜像、数据卷、网络等资源状态,支持容器的启停、日志查看、终端命令执行、端口映射配置等运维操作。集成应用模板,可一键部署常见服务,大幅简化 Docker 管理复杂度,是提升容器化运维效率的必备神器。 |
HelloGitHub |
https://github.com/521xueweihan/HelloGitHub |
一个专注于发掘和汇总 GitHub 上有趣、实用开源项目的精品社区库,被誉为“开源项目导航宝典”。每月28日以月刊形式更新,已持续发布110期,累计收录4000+优质项目,GitHub Star 数突破116K。内容涵盖五大类:编程学习(如《Python100天》、算法图解)、效率工具(系统优化、PDF处理、软件管理)、趣味项目(3DS模拟器、乐高生成器、ASCII艺术)、大型实战(权限系统、视频监控、微服务架构)以及免费技术书籍(神经网络、系统设计等)。分类清晰,项目精炼,是开发者学习、提升效率和寻找灵感的首选资源平台。 |
websocket-devtools |
https://github.com/law-chain-hot/websocket-devtools |
一款开箱即用的 WebSocket 调试浏览器插件,专为开发者设计,集成于 Chrome DevTools,安装后自动新增独立标签页,无缝融入现有开发环境。支持 WebSocket 连接的实时监控、消息收发记录查看、手动发送消息模拟、连接状态追踪及流量拦截等核心功能,操作直观便捷。适用于调试 Web 应用中的实时通信逻辑,是开发和测试 WebSocket 服务的高效辅助工具。 |
Seelen-UI |
https://github.com/eythaann/Seelen-UI |
一款免费开源的 Windows 桌面美化与增强工具,采用 Rust 语言和 Tauri 框架开发,兼顾性能与可扩展性。支持高度自定义界面,提供窗口平铺管理(类似 macOS 或 Linux 的分屏布局)、全局应用启动器、可定制 Dock 栏、现代化任务栏、动态壁纸及插件扩展系统。融合 Web 技术实现流畅美观的 UI,旨在提升 Windows 用户的视觉体验与操作效率,是追求个性化与生产力兼顾的桌面环境的理想选择。 |
Podman Desktop |
https://github.com/podman-desktop/podman-desktop |
一款跨平台、免费开源的容器与 Kubernetes 桌面管理工具,为开发者提供直观的图形化界面,用于容器和 K8s 集群的构建、管理和部署。支持多种主流容器运行时,包括 Podman、Docker、Lima 和 kind,可无缝切换和统一管理。集成镜像构建、容器生命周期管理、资源监控、K8s 配置编辑与部署等功能,简化本地开发与测试流程,是提升容器化应用开发效率的轻量级桌面解决方案。 |
Inkeys |
https://github.com/Alan-CRL/Inkeys |
一款免费开源的 Windows 屏幕批注工具,提供流畅自然的画笔书写体验,支持多种笔刷、颜色、线条粗细及形状标注(如箭头、矩形、圆形等)。功能丰富,操作简便,可在任意屏幕上进行实时绘图与注释,适用于教学授课、远程会议演示、日常办公协作等场景,帮助用户高效传达信息,提升演示与沟通效率。 |
Windhawk |
https://github.com/ramensoftware/windhawk |
一款专为 Windows 平台打造的开源软件定制与扩展框架,被誉为“Windows 版 LSPosed”。通过全局注入和 Hook 技术,将原本需要修改二进制文件或注册表才能实现的界面美化、功能增强和交互优化,封装成可一键安装的 mod(插件)。用户可通过图形化界面轻松浏览、安装、更新和管理各类 mod,自定义系统及第三方应用的外观与行为,无需编程即可深度定制 Windows 体验,是高级用户提升系统个性化与生产力的强大工具。 |
ezBookkeeping |
https://github.com/mayswind/ezbookkeeping |
一款免费、轻量且可自托管的个人财务管理应用,采用 Go(后端)与 Vue(前端)技术栈构建,兼顾性能与用户体验。支持个人与家庭多账户管理、细粒度收支分类、交易记录附带图片附件、定期收支自动记账等实用功能。界面简洁直观,操作流畅。借助 PWA(渐进式网页应用)技术,可一键添加至手机或桌面主屏幕,无需安装原生 App 即可获得类原生应用的使用体验,是注重隐私、追求数据自主的用户的理想记账解决方案。 |
Embedding Atlas |
https://github.com/apple/embedding-atlas |
由 Apple 开源的大规模嵌入(Embeddings)数据交互式可视化工具,专为机器学习研究人员和开发者设计。支持高维嵌入数据的直观浏览、动态筛选、关键词搜索及元信息关联展示,帮助用户深入理解模型内部表示。提供高效的可视化渲染与交互能力,便于探索嵌入空间的结构、聚类关系和语义分布,是分析和调试 NLP、推荐系统等模型中嵌入质量与行为的有力工具。 |