2022 – 机器学习/人工智能

2022年12月11日作者 admin

机器学习/人工智能

名称	简述	源
Paper Picture Writing Code	GitHub 上开源的 LaTeX 画图代码库。里面包含了几种 AI 论文中常用的画图代码，如折线图、柱状图、散点图、注意力可视化以及结构图等。
PaddleHub	百度在 GitHub 上开源的一款预训练模型工具包：PaddleHub，涵盖了大模型、CV、NLP、Audio、Video、工业应用等 400+ 预训练模型，代码全部开源，离线可运行。
AiLearning-Theory-Applying	GitHub 上一个开源的 AI 知识库，主要帮助开发者快速上手 AI 理论及应用实战，基础知识、机器学习、深度学习、自然语言处理 BERT，含大量注释及数据集，力求每一位能看懂并复现。
Dot	是 GitHub 上一个开源的 Deepfake AI 换脸攻击工具包。针对身份验证、视频会议系统等渗透测试工作而生，可供安全分析师、红队成员和生物识别研究人员使用。
ClearML	GitHub 上一个开源的机器学习工具包：ClearML，自带简洁美观的可视化界面。该工具可用于简化机器学习开发、运维流程，自动完成实验跟踪与结果记录，并提供了灵活多变的数据管理方案。
Image-Processing-Node-Editor	日本开发者在 GitHub 开源的一款图像处理节点编辑器，通过该工具，可以辅助并完成深度学习的各项图像处理工作，快速验证、对比各个图像在不同条件下的执行结果。
BEVFormer	GitHub 上一套开源的环视物体检测方案：BEVFormer，实现了在鸟瞰图视角下的特征优化，可应用于汽车自动驾驶场景。
Paper2GUI	一款面向普通人的 AI 桌面 APP 工具箱，开箱即用，非常方便，已支持 15+ AI 模型，内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、图片 OCR 识别等领域，兼容 Windows、Mac、Linux 等主流操作系统。
FinRL	GitHub 上一个开源的量化金融自动交易框架：FinRL，附带有完整的深度学习、量化交易技术教程。项目覆盖了各类常用市场，并提供先进的算法核心，支持各种金融任务（投资组合分配、加密货币交易、高频交易）、实时交易等功能。
internet-dataset	这个 GitHub 仓库收录了各种通过搜索引擎获取的数据集，整体数据量将近 50G，其中包括域名、网页、反向索引等数据。
Energon-AI	GitHub 上一个开源的大模型推理系统：Energon-AI。仅需对现有项目进行极少量修改，即可完成自定义大模型的推理部署，获得并行扩展的超线性加速。对于 AI 大模型分布式推理加速，相比英伟达 FasterTransformer 可提升 50% 以上。
Colossal-AI	国人在 GitHub 开源的一个项目：Colossal-AI，仅需极少量修改，即可让现有深度学习项目，在单张消费级显卡上，完成大模型训练，极大降低了项目研发成本！简而言之，有了这个开源项目后，每个人都可以在家训练 AI 大模型！尤其是大幅度降低了 AI 大模型微调、推理等下游任务和应用部署的门槛。
Gradio	GitHub 上这个名为 Gradio 的开源项目，可在短短几分钟内，为机器学习模型生成一个简洁、优雅的 UI 界面，让你能在浏览器中进行项目演示。通过该界面，你可以完成拖拽上传图像、粘贴文本、声音录制等操作，并查看模型输出内容。
nlp-paper	字节跳动工程师在 GitHub 上整理的 NLP 论文列表（附阅读笔记），收录了一些比较经典或思路新奇的论文。其中包含 NLP 领域下的对话语音领域，复现模型以及数据处理等（代码含 TensorFlow 和 PyTorch 两版本）
Goopt	国外有位开发者基于 GPT-3 做了一款 AI 搜索引擎：Goopt，通过该搜索引擎检索到的所有内容，全部都是由 AI 和算法合成的。你可以在上面搜索任意术语，以获取相关结果与内容。通过这种方式，进一步模拟网页浏览体验
AI-Paper-Collector	GitHub 上一个开源的 Python 脚本：AI-Paper-Collector，可用于查找包含指定关键词的顶会论文列表，涵盖了 2019-2021 自然语言处理，计算机视觉，信息检索等领域的顶会论文。
ChineseLyrics	GitHub 上开源的中文歌词数据库，作者收录了 10W+ 首歌词数据，给做 NLP 和数据分析领域的朋友们提供参考。
ROS-Face	一个挺有意思的开源项目。作者希望通过 ROS（机器人操作系统）来控制人脸面部表情，让面部动作听从机械指令
nlp-notebook	GitHub 上开源的 NLP 领域常见任务的实现：nlp-notebook，包括新词发现、以及基于 PyTorch 的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。
funNLP	几乎最全的中文 NLP 资源库。包括中英文敏感词、语言检测、中外手机 / 电话归属地 / 运营商查询、名字推断性别、手机号抽取、身份证抽取等内容。
Colossal-AI	GitHub 上一个增长迅猛的国产 AI 开源项目：Colossal-AI，可用于 AI 大规模并行训练，仅需一半数量的 GPU，便能完成相同效果的 GPT-3 训练工作，极大降低了项目研发成本！
NeuralSpeech	微软亚洲研究院在 GitHub 开源的一个项目：NeuralSpeech ，提供了基于神经网络的语音处理，包括自动语音识别（ASR）、文本转语音（TTS）等。
virtual_try_on_use_deep_learning	使用深度学习算法实现虚拟试衣，结合了人体姿态估计、人体分割、几何匹配和 GAN，四种模型，只依赖 opencv 库就能运行。
ml4a	如果你正在尝试用 AI 来进行艺术创作，那么可以看下 ml4a 这个开源 Python 库。作者通过代码封装的方式，将 AI 艺术创作类的开源项目整合到了一起，包括图像风格迁移、基于素描的图像生成、图片分辨率增强、图像卡通话等模型。
《AI as an API》	GitHub 上的人工智能技术教程：《AI as an API》，主要讲解如何基于 NLP 技术，开发一个文本分类器，并进行持续化数据存储，封装成 API。教程学习时长，约为 50 分钟左右，适合在工作之余的闲暇时间动手学习。
FastFold	GitHub 上开源了一套训练推理加速方案，通过引入 GPU 优化和大模型训练技术，可将 AlphaFold 总体训练时间从 11 天减少到 67 小时，且总成本更低，在长序列推理中也实现 9.3 ∼ 11.6 倍提升，加速效果颇为显著。
Colossal-AI	国人在 GitHub 开源的一个深度学习系统：Colossal-AI，可用于 AI 大规模并行训练。仅需一半数量的 GPU，便能完成相同效果的 GPT-3 训练工作，极大降低了项目研发成本！
SofGAN	作用是可通过计算机视觉和模式识别技术，生成一张支持风格动态调整的人物肖像。
Hugging Face	Hugging Face 对外开放的机器学习任务列表，可以说整理的非常全面了。里面覆盖了自然语言处理、音频、计算机视觉等多个分类，其中包括掩蔽语言填充、智能问答、文本分类、文本翻译、语音识别、图像分割和物体检测等任务。每个任务都附有相对应的使用场景介绍、实际案例、学习指南、模型、数据集等资源。
NeRF	一款 AI 模型，可借助人工智能技术，把多张 2D 图片进行拼接，进而生成该图片的 3D 模型。
annotated_latex_equations	GitHub 上一个开源的 LaTeX 示例库，教你如何使用 Tikz 创建彩色的 LaTeX 注释，让论文变得更为简洁与美观。
动漫肖像魔法	来自麻省理工大学的工作室 sizigi，发布的一款很有意思的 AI 工具，你可以通过选择头像、滤镜、风格、动作等 4 个步骤，来定制一个专属的二次元老婆 / 老公
ddddocr	一个开源的中文 OCR 通用验证码 Python 识别库，通过大批量生成随机数据，并进行深度网络训练，帮助厂商检验自家验证码的难易强度。

发表评论取消回复