| Paper Picture Writing Code | GitHub 上开源的 LaTeX 画图代码库。里面包含了几种 AI 论文中常用的画图代码,如折线图、柱状图、散点图、注意力可视化以及结构图等。 |  |
| PaddleHub | 百度在 GitHub 上开源的一款预训练模型工具包:PaddleHub,涵盖了大模型、CV、NLP、Audio、Video、工业应用等 400+ 预训练模型,代码全部开源,离线可运行。 |  |
| AiLearning-Theory-Applying | GitHub 上一个开源的 AI 知识库,主要帮助开发者快速上手 AI 理论及应用实战,基础知识、机器学习、深度学习、自然语言处理 BERT,含大量注释及数据集,力求每一位能看懂并复现。 |  |
| Dot | 是 GitHub 上一个开源的 Deepfake AI 换脸攻击工具包。针对身份验证、视频会议系统等渗透测试工作而生,可供安全分析师、红队成员和生物识别研究人员使用。 |  |
| ClearML | GitHub 上一个开源的机器学习工具包:ClearML,自带简洁美观的可视化界面。该工具可用于简化机器学习开发、运维流程,自动完成实验跟踪与结果记录,并提供了灵活多变的数据管理方案。 |  |
| Image-Processing-Node-Editor | 日本开发者在 GitHub 开源的一款图像处理节点编辑器,通过该工具,可以辅助并完成深度学习的各项图像处理工作,快速验证、对比各个图像在不同条件下的执行结果。 |  |
| BEVFormer | GitHub 上一套开源的环视物体检测方案:BEVFormer,实现了在鸟瞰图视角下的特征优化,可应用于汽车自动驾驶场景。 |  |
| Paper2GUI | 一款面向普通人的 AI 桌面 APP 工具箱,开箱即用,非常方便,已支持 15+ AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、图片 OCR 识别等领域,兼容 Windows、Mac、Linux 等主流操作系统。 |  |
| FinRL | GitHub 上一个开源的量化金融自动交易框架:FinRL,附带有完整的深度学习、量化交易技术教程。项目覆盖了各类常用市场,并提供先进的算法核心,支持各种金融任务(投资组合分配、加密货币交易、高频交易)、实时交易等功能。 |  |
| internet-dataset | 这个 GitHub 仓库收录了各种通过搜索引擎获取的数据集,整体数据量将近 50G,其中包括域名、网页、反向索引等数据。 |  |
| Energon-AI | GitHub 上一个开源的大模型推理系统:Energon-AI。仅需对现有项目进行极少量修改,即可完成自定义大模型的推理部署,获得并行扩展的超线性加速。对于 AI 大模型分布式推理加速,相比英伟达 FasterTransformer 可提升 50% 以上。 |  |
| Colossal-AI | 国人在 GitHub 开源的一个项目:Colossal-AI,仅需极少量修改,即可让现有深度学习项目,在单张消费级显卡上,完成大模型训练,极大降低了项目研发成本!简而言之,有了这个开源项目后,每个人都可以在家训练 AI 大模型!尤其是大幅度降低了 AI 大模型微调、推理等下游任务和应用部署的门槛。 |  |
| Gradio | GitHub 上这个名为 Gradio 的开源项目,可在短短几分钟内,为机器学习模型生成一个简洁、优雅的 UI 界面,让你能在浏览器中进行项目演示。通过该界面,你可以完成拖拽上传图像、粘贴文本、声音录制等操作,并查看模型输出内容。 |  |
| nlp-paper | 字节跳动工程师在 GitHub 上整理的 NLP 论文列表(附阅读笔记),收录了一些比较经典或思路新奇的论文。其中包含 NLP 领域下的对话语音领域,复现模型以及数据处理等(代码含 TensorFlow 和 PyTorch 两版本) |  |
| Goopt | 国外有位开发者基于 GPT-3 做了一款 AI 搜索引擎:Goopt,通过该搜索引擎检索到的所有内容,全部都是由 AI 和算法合成的。你可以在上面搜索任意术语,以获取相关结果与内容。通过这种方式,进一步模拟网页浏览体验 |  |
| AI-Paper-Collector | GitHub 上一个开源的 Python 脚本:AI-Paper-Collector,可用于查找包含指定关键词的顶会论文列表,涵盖了 2019-2021 自然语言处理,计算机视觉,信息检索等领域的顶会论文。 |  |
| ChineseLyrics | GitHub 上开源的中文歌词数据库,作者收录了 10W+ 首歌词数据,给做 NLP 和数据分析领域的朋友们提供参考。 |  |
| ROS-Face | 一个挺有意思的开源项目。作者希望通过 ROS(机器人操作系统)来控制人脸面部表情,让面部动作听从机械指令 |  |
| nlp-notebook | GitHub 上开源的 NLP 领域常见任务的实现:nlp-notebook,包括新词发现、以及基于 PyTorch 的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。 |  |
| funNLP | 几乎最全的中文 NLP 资源库。包括中英文敏感词、语言检测、中外手机 / 电话归属地 / 运营商查询、名字推断性别、手机号抽取、身份证抽取等内容。 |  |
| Colossal-AI | GitHub 上一个增长迅猛的国产 AI 开源项目:Colossal-AI,可用于 AI 大规模并行训练,仅需一半数量的 GPU,便能完成相同效果的 GPT-3 训练工作,极大降低了项目研发成本! |  |
| NeuralSpeech | 微软亚洲研究院在 GitHub 开源的一个项目:NeuralSpeech ,提供了基于神经网络的语音处理,包括自动语音识别(ASR)、文本转语音(TTS)等。 |  |
| virtual_try_on_use_deep_learning | 使用深度学习算法实现虚拟试衣,结合了人体姿态估计、人体分割、几何匹配和 GAN,四种模型,只依赖 opencv 库就能运行。 |  |
| ml4a | 如果你正在尝试用 AI 来进行艺术创作,那么可以看下 ml4a 这个开源 Python 库。作者通过代码封装的方式,将 AI 艺术创作类的开源项目整合到了一起,包括图像风格迁移、基于素描的图像生成、图片分辨率增强、图像卡通话等模型。 |  |
| 《AI as an API》 | GitHub 上的人工智能技术教程:《AI as an API》,主要讲解如何基于 NLP 技术,开发一个文本分类器,并进行持续化数据存储,封装成 API。教程学习时长,约为 50 分钟左右,适合在工作之余的闲暇时间动手学习。 |  |
| FastFold | GitHub 上开源了一套训练推理加速方案,通过引入 GPU 优化和大模型训练技术,可将 AlphaFold 总体训练时间 从 11 天减少到 67 小时,且总成本更低,在长序列推理中也实现 9.3 ∼ 11.6 倍提升,加速效果颇为显著。 |  |
| Colossal-AI | 国人在 GitHub 开源的一个深度学习系统:Colossal-AI,可用于 AI 大规模并行训练。仅需一半数量的 GPU,便能完成相同效果的 GPT-3 训练工作,极大降低了项目研发成本! |  |
| SofGAN | 作用是可通过计算机视觉和模式识别技术,生成一张支持风格动态调整的人物肖像。 |  |
| Hugging Face | Hugging Face 对外开放的机器学习任务列表,可以说整理的非常全面了。里面覆盖了自然语言处理、音频、计算机视觉等多个分类,其中包括掩蔽语言填充、智能问答、文本分类、文本翻译、语音识别、图像分割和物体检测等任务。每个任务都附有相对应的使用场景介绍、实际案例、学习指南、模型、数据集等资源。 |  |
| NeRF | 一款 AI 模型,可借助人工智能技术,把多张 2D 图片进行拼接,进而生成该图片的 3D 模型。 |  |
| annotated_latex_equations | GitHub 上一个开源的 LaTeX 示例库,教你如何使用 Tikz 创建彩色的 LaTeX 注释,让论文变得更为简洁与美观。 |  |
| 动漫肖像魔法 | 来自麻省理工大学的工作室 sizigi,发布的一款很有意思的 AI 工具,你可以通过选择头像、滤镜、风格、动作等 4 个步骤,来定制一个专属的二次元老婆 / 老公 |  |
| ddddocr | 一个开源的中文 OCR 通用验证码 Python 识别库,通过大批量生成随机数据,并进行深度网络训练,帮助厂商检验自家验证码的难易强度。 |  |