2022 – 机器学习/人工智能

机器学习/人工智能

名称简述
Paper Picture Writing CodeGitHub 上开源的 LaTeX 画图代码库。里面包含了几种 AI 论文中常用的画图代码,如折线图、柱状图、散点图、注意力可视化以及结构图等。
PaddleHub百度在 GitHub 上开源的一款预训练模型工具包:PaddleHub,涵盖了大模型、CV、NLP、Audio、Video、工业应用等 400+ 预训练模型,代码全部开源,离线可运行。
AiLearning-Theory-ApplyingGitHub 上一个开源的 AI 知识库,主要帮助开发者快速上手 AI 理论及应用实战,基础知识、机器学习、深度学习、自然语言处理 BERT,含大量注释及数据集,力求每一位能看懂并复现。
Dot是 GitHub 上一个开源的 Deepfake AI 换脸攻击工具包。针对身份验证、视频会议系统等渗透测试工作而生,可供安全分析师、红队成员和生物识别研究人员使用。
ClearMLGitHub 上一个开源的机器学习工具包:ClearML,自带简洁美观的可视化界面。该工具可用于简化机器学习开发、运维流程,自动完成实验跟踪与结果记录,并提供了灵活多变的数据管理方案。
Image-Processing-Node-Editor日本开发者在 GitHub 开源的一款图像处理节点编辑器,通过该工具,可以辅助并完成深度学习的各项图像处理工作,快速验证、对比各个图像在不同条件下的执行结果。
BEVFormerGitHub 上一套开源的环视物体检测方案:BEVFormer,实现了在鸟瞰图视角下的特征优化,可应用于汽车自动驾驶场景。
Paper2GUI一款面向普通人的 AI 桌面 APP 工具箱,开箱即用,非常方便,已支持 15+ AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、图片 OCR 识别等领域,兼容 Windows、Mac、Linux 等主流操作系统。
FinRLGitHub 上一个开源的量化金融自动交易框架:FinRL,附带有完整的深度学习、量化交易技术教程。项目覆盖了各类常用市场,并提供先进的算法核心,支持各种金融任务(投资组合分配、加密货币交易、高频交易)、实时交易等功能。
internet-dataset这个 GitHub 仓库收录了各种通过搜索引擎获取的数据集,整体数据量将近 50G,其中包括域名、网页、反向索引等数据。
Energon-AIGitHub 上一个开源的大模型推理系统:Energon-AI。仅需对现有项目进行极少量修改,即可完成自定义大模型的推理部署,获得并行扩展的超线性加速。对于 AI 大模型分布式推理加速,相比英伟达 FasterTransformer 可提升 50% 以上。
Colossal-AI国人在 GitHub 开源的一个项目:Colossal-AI,仅需极少量修改,即可让现有深度学习项目,在单张消费级显卡上,完成大模型训练,极大降低了项目研发成本!简而言之,有了这个开源项目后,每个人都可以在家训练 AI 大模型!尤其是大幅度降低了 AI 大模型微调、推理等下游任务和应用部署的门槛。
GradioGitHub 上这个名为 Gradio 的开源项目,可在短短几分钟内,为机器学习模型生成一个简洁、优雅的 UI 界面,让你能在浏览器中进行项目演示。通过该界面,你可以完成拖拽上传图像、粘贴文本、声音录制等操作,并查看模型输出内容。
nlp-paper字节跳动工程师在 GitHub 上整理的 NLP 论文列表(附阅读笔记),收录了一些比较经典或思路新奇的论文。其中包含 NLP 领域下的对话语音领域,复现模型以及数据处理等(代码含 TensorFlow 和 PyTorch 两版本)
Goopt国外有位开发者基于 GPT-3 做了一款 AI 搜索引擎:Goopt,通过该搜索引擎检索到的所有内容,全部都是由 AI 和算法合成的。你可以在上面搜索任意术语,以获取相关结果与内容。通过这种方式,进一步模拟网页浏览体验
AI-Paper-CollectorGitHub 上一个开源的 Python 脚本:AI-Paper-Collector,可用于查找包含指定关键词的顶会论文列表,涵盖了 2019-2021 自然语言处理,计算机视觉,信息检索等领域的顶会论文。
ChineseLyricsGitHub 上开源的中文歌词数据库,作者收录了 10W+ 首歌词数据,给做 NLP 和数据分析领域的朋友们提供参考。
ROS-Face一个挺有意思的开源项目。作者希望通过 ROS(机器人操作系统)来控制人脸面部表情,让面部动作听从机械指令
nlp-notebookGitHub 上开源的 NLP 领域常见任务的实现:nlp-notebook,包括新词发现、以及基于 PyTorch 的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。
funNLP几乎最全的中文 NLP 资源库。包括中英文敏感词、语言检测、中外手机 / 电话归属地 / 运营商查询、名字推断性别、手机号抽取、身份证抽取等内容。
Colossal-AIGitHub 上一个增长迅猛的国产 AI 开源项目:Colossal-AI,可用于 AI 大规模并行训练,仅需一半数量的 GPU,便能完成相同效果的 GPT-3 训练工作,极大降低了项目研发成本!
NeuralSpeech微软亚洲研究院在 GitHub 开源的一个项目:NeuralSpeech ,提供了基于神经网络的语音处理,包括自动语音识别(ASR)、文本转语音(TTS)等。
virtual_try_on_use_deep_learning使用深度学习算法实现虚拟试衣,结合了人体姿态估计、人体分割、几何匹配和 GAN,四种模型,只依赖 opencv 库就能运行。
ml4a如果你正在尝试用 AI 来进行艺术创作,那么可以看下 ml4a 这个开源 Python 库。作者通过代码封装的方式,将 AI 艺术创作类的开源项目整合到了一起,包括图像风格迁移、基于素描的图像生成、图片分辨率增强、图像卡通话等模型。
《AI as an API》GitHub 上的人工智能技术教程:《AI as an API》,主要讲解如何基于 NLP 技术,开发一个文本分类器,并进行持续化数据存储,封装成 API。教程学习时长,约为 50 分钟左右,适合在工作之余的闲暇时间动手学习。 ​​​
FastFoldGitHub 上开源了一套训练推理加速方案,通过引入 GPU 优化和大模型训练技术,可将 AlphaFold 总体训练时间 从 11 天减少到 67 小时,且总成本更低,在长序列推理中也实现 9.3 ∼ 11.6 倍提升,加速效果颇为显著。
Colossal-AI国人在 GitHub 开源的一个深度学习系统:Colossal-AI,可用于 AI 大规模并行训练。仅需一半数量的 GPU,便能完成相同效果的 GPT-3 训练工作,极大降低了项目研发成本!
SofGAN作用是可通过计算机视觉和模式识别技术,生成一张支持风格动态调整的人物肖像。
Hugging FaceHugging Face 对外开放的机器学习任务列表,可以说整理的非常全面了。里面覆盖了自然语言处理、音频、计算机视觉等多个分类,其中包括掩蔽语言填充、智能问答、文本分类、文本翻译、语音识别、图像分割和物体检测等任务。每个任务都附有相对应的使用场景介绍、实际案例、学习指南、模型、数据集等资源。
NeRF一款 AI 模型,可借助人工智能技术,把多张 2D 图片进行拼接,进而生成该图片的 3D 模型。
annotated_latex_equationsGitHub 上一个开源的 LaTeX 示例库,教你如何使用 Tikz 创建彩色的 LaTeX 注释,让论文变得更为简洁与美观。
动漫肖像魔法来自麻省理工大学的工作室 sizigi,发布的一款很有意思的 AI 工具,你可以通过选择头像、滤镜、风格、动作等 4 个步骤,来定制一个专属的二次元老婆 / 老公
ddddocr一个开源的中文 OCR 通用验证码 Python 识别库,通过大批量生成随机数据,并进行深度网络训练,帮助厂商检验自家验证码的难易强度。

发表评论