「论文解读」Self-Supervised Person Detection in 2D Range Data using a Calibrated Camera
相关资源:深度估计资源
使用 khadas 官方发布的 A311D NPU demo;
2021-01月份还在测试 npu 功能,由 tengine 发给 khadas,最终 khadas 释放出来;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门; 支持 Caffe/Tensorflow/Tflite/Darknet/Onnx/Keras/Pytroch 模型
目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;
目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态
ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法
模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)
优化器资源
卷积网络资源
反向传播的实质是链式求导
轻量型网络资源、卷积网络概述
XAI
目标检测资源
论文发表时间:2019-03-13 作者:Zhengxia Zou (1), Zhenwei Shi (2), Yuhong Guo (3 and 4), Jieping Ye (1 and 4) ((1) University of Michigan, (2) Beihang Un...
论文发表时间:2018-09-06,IJCV 2018 作者:Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 论文地址:https://a...
论文发表时间:2019-07-11 作者:Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu 论文地址:https://arxiv.org/abs/1907.09...
论文发表时间:2018-07-15 作者:Zhong-Qiu Zhao, Peng Zheng, Shou-tao Xu, Xindong Wu 论文地址:https://arxiv.org/abs/1807.05511
通用目标检测资源、GAN 资源、自编码器资源
论文汇总
又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源
已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;
一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;
通用物体分类资源
通用图像生成资源、人脸生成资源、季节变换资源、对抗生成网络资源 style transfer
比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;
修补图像中少量的缺失;
替换掉图像中的某些物件或部位;
对抗生成网络资源、通用图像生成资源、风格迁移资源、人脸生成资源
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程
视频业务相关企业
从视频中解出图像;
视频相关研究员
计算两个序列的相似度,可找到两者公共的部分,可带容错; 字符串匹配
通用物体分割资源
通用物体分割资源
通用物体分割资源
检测行人和人体各部位; 通用目标检测资源
相关资料:视频描述资源汇总
通用物体分类资源,通用目标检测资源,自动驾驶资源
交通场景中分割出车辆; 通用物体分割资源
找到不同交通场景中的同一个车辆; 图片检索资源、车辆分割资源、车辆检测资源
找到产品中的瑕疵区域;
通用图像编辑资源
通用图像生成资源、风格迁移资源、季节变换资源、对抗生成网络资源
Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...
参考源码: https://github.com/chuanqi305/MobileNet-SSD 环境: https://github.com/weiliu89/caffe/tree/ssd
2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...
商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;
百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...
2017-09-07 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...
2017-12-19 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef
阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS
腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home
阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....
腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...
相关资源:对抗攻击资源
相关资料:图片描述资源汇总
也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述
相关资料:视频检索资源 · 图像检索资源
通用目标检测资源,自动驾驶资源
实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;
视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述
相关资料:视频检索资源汇总 · 图片检索概述
光学字符识别;感觉在 2017 年爆炸了; 相关资源:目标检测资源
Google Landmark Retrieval 2019: https://www.kaggle.com/c/landmark-retrieval-2019 2019.05.27 ~ 2019.06.10; CVPR 2019 标志建筑识别;
竞赛主页:https://competition.aihero100.com/
扩大图像的分辨率,获得清晰画质;在医疗和卫星成像上有着重要应用;
数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;
在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;
汇总常用竞赛网站
竞赛主页:https://challenge.rtcdeveloper.com/ai-in-rtc/ 赛道一(算法赛):AI in RTC-超分辨率图像质量比较挑战赛 赛道二(算法赛):AI in RTC-超分辨率算法性能比较挑战赛 赛道三(应用赛):【线上黑客马拉松】RTC编程挑战赛
识别出不匹配预期模式或数据;异常也被称为离群值、新奇、噪声、偏差和例外;
相关资源:对抗攻击概述
video inpaint
视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...
车辆相关属性识别; 物体分类资源
竞赛主页:https://tianchi.aliyun.com/competition/entrance/231717/introduction
竞赛主页:https://www.kesci.com/home/competition/5d142d8cbb14e6002c04e14a/content
相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源
video localization
诸多视频分析技术都是以关键帧提取作为基础,在此就做一个汇总; 相关资源:关键帧提取概述
根据输入的文字找到图片中的物体; 通用目标检测资源,通用物体分割资源
shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...
训练数据不包含标注信息的情况下完成目标任务; 表示学习资源
训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源
识别从未见过的数据类别,使模型具有知识迁移的能力;
通用物体分割资源
通用物体分割资源
顶会论文于业界常常具有导向作用;
源码:https://github.com/opencv/opencv docs:https://docs.opencv.org
相关资源:目标检测资源
相关资料:图片检索概述、视频检索资源 · 音频检索资源
FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;
模型量化概述
卷积网络概述
attention
ICLR 2019 论文发表时间:2018-10-01 作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学) 论文地址:https://arxiv.org/abs/1810.04511
ICLR 2016 论文发表时间:2015-11-12 作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov 单位:Department of Computer Science, University of Toronto 论文地址:...
video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;
CNN
shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection
重识别资源汇总
pose estimation · action classification
通用图像修复资源
目标检测概述
Batch Normalization,Layer Normalizaiton,Instance Normalization,Group Normalization,Switchable Normalization
给出可以摆放物体的位置;
自编码相关资源;
智能算法在没有人为指导的情况下,通过不断的试错来提升任务性能的过程;
生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;
实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...
文章将简略介绍 GAN 中用到的深度学习概念;
过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;
视角转换:改变输入图像的视角; 本文汇总相关资源;
深度估计:根据单张图像得到深度图; 深度估计概述
图1. 三维重建任务概览
「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
论文发表时间:2018年07月15日 论文:https://arxiv.org/abs/1807.05520
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
1 资料 1.1 推荐书籍
TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....
mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg
附录 A 资料
一、 常见误区 想当然地使用默认的损失函数 一般情况下使用均方误差效果还行;但在现实应用中,需根据业务需求定制; 拿诈骗检测来说;为了达到业务目标,我们需按照与欺诈相关的美元金额的比例来惩罚假阴性以减少诈骗带来的损失; 效果 OK 与最好是两个概念;通用的损失函数,往往是 OK; 如何定制啊
每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;
排名不分先后
又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;
论文发表时间:2018年12月 论文地址:https://arxiv.org/abs/1812.01187 文章整理对比了CNN分类网络中常用的一些tricks,例如改善模型结构,训练过程的精修,包括修改损失函数、数据预处理等;
https://blog.csdn.net/dengbingfeng/article/details/51453851 https://zhuanlan.zhihu.com/p/33625603
相关资源:深度估计资源
目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;
目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态
ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法
目标检测资源
论文发表时间:2019-03-13 作者:Zhengxia Zou (1), Zhenwei Shi (2), Yuhong Guo (3 and 4), Jieping Ye (1 and 4) ((1) University of Michigan, (2) Beihang Un...
论文发表时间:2018-09-06,IJCV 2018 作者:Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 论文地址:https://a...
论文发表时间:2019-07-11 作者:Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu 论文地址:https://arxiv.org/abs/1907.09...
论文发表时间:2018-07-15 作者:Zhong-Qiu Zhao, Peng Zheng, Shou-tao Xu, Xindong Wu 论文地址:https://arxiv.org/abs/1807.05511
通用目标检测资源、GAN 资源、自编码器资源
通用物体分类资源
通用图像生成资源、人脸生成资源、季节变换资源、对抗生成网络资源 style transfer
比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;
修补图像中少量的缺失;
替换掉图像中的某些物件或部位;
对抗生成网络资源、通用图像生成资源、风格迁移资源、人脸生成资源
通用物体分割资源
通用物体分割资源
通用物体分割资源
检测行人和人体各部位; 通用目标检测资源
相关资料:视频描述资源汇总
通用物体分类资源,通用目标检测资源,自动驾驶资源
交通场景中分割出车辆; 通用物体分割资源
找到不同交通场景中的同一个车辆; 图片检索资源、车辆分割资源、车辆检测资源
找到产品中的瑕疵区域;
通用图像编辑资源
通用图像生成资源、风格迁移资源、季节变换资源、对抗生成网络资源
Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...
参考源码: https://github.com/chuanqi305/MobileNet-SSD 环境: https://github.com/weiliu89/caffe/tree/ssd
相关资源:对抗攻击资源
也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述
通用目标检测资源,自动驾驶资源
光学字符识别;感觉在 2017 年爆炸了; 相关资源:目标检测资源
扩大图像的分辨率,获得清晰画质;在医疗和卫星成像上有着重要应用;
数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;
在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;
相关资源:对抗攻击概述
车辆相关属性识别; 物体分类资源
根据输入的文字找到图片中的物体; 通用目标检测资源,通用物体分割资源
通用物体分割资源
通用物体分割资源
相关资料:图片检索概述、视频检索资源 · 音频检索资源
CNN
重识别资源汇总
pose estimation · action classification
通用图像修复资源
目标检测概述
给出可以摆放物体的位置;
视角转换:改变输入图像的视角; 本文汇总相关资源;
深度估计:根据单张图像得到深度图; 深度估计概述
图1. 三维重建任务概览
论文发表时间:2018年07月15日 论文:https://arxiv.org/abs/1807.05520
排名不分先后
论文发表时间:2018年12月 论文地址:https://arxiv.org/abs/1812.01187 文章整理对比了CNN分类网络中常用的一些tricks,例如改善模型结构,训练过程的精修,包括修改损失函数、数据预处理等;
https://blog.csdn.net/dengbingfeng/article/details/51453851 https://zhuanlan.zhihu.com/p/33625603
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
多版本 API
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具
让你能够跑通地一个 qss 项目;
字符串匹配,可范化为序列匹配;
主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;
官网 http://www.numpy.org/ 功能:一个常用的科学计算库;
官网 https://matplotlib.org/ 功能:一个二维图像绘制库;
一、 介绍
官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;
一、 介绍
一、 定义
一、 介绍
一、 词法
前导知识:(懂程序设计基础,面向对象程序设计更好)
定义:定义一个操作中的算法的骨架,而将步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义算法的某些特定步骤。【抽象类】——基于继承的代码复用技术
replace FIFO_RepIaceAIgorithm ReplaceO ReplaceAIgorithm «abstract» ReplaceO LRU_RepIaceAIgorithm ReplaceO Cache algorithm CacheO —Cache() ReplaceO Random_Rep...
背景:类的行为是随着它的状态改变的而改变
单例模式 和 MONOSTATE
定义:定义了对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都
一、 学习目标 理解松耦合设计思想 掌握面向对象设计原则 掌握重构技巧 掌握核心设计模式
背景:不必改变原类文件和使用继承的情况下,动态的扩展一个对象的的功能。 方案:利用子对象,委派
抽象工厂
阅读这些书可以帮助你避免一些常见的陷阱和错误,一些开发人员早期经历的陷阱和犯过的错误;
参考:AI 研习社——自动驾驶视角下的工程代码基础
训练简单
用来执行多条命令;
会用基本挂载命令;
找到最适合自己的学单词方式,工具和方法在于精而不在多,将任何一种用到极致,都能创造惊喜;
模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)
优化器资源
卷积网络资源
反向传播的实质是链式求导
轻量型网络资源、卷积网络概述
论文汇总
又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源
已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;
一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;
训练数据不包含标注信息的情况下完成目标任务; 表示学习资源
训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源
识别从未见过的数据类别,使模型具有知识迁移的能力;
FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;
模型量化概述
卷积网络概述
attention
Batch Normalization,Layer Normalizaiton,Instance Normalization,Group Normalization,Switchable Normalization
自编码相关资源;
生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;
实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...
文章将简略介绍 GAN 中用到的深度学习概念;
过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;
「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...
1 资料 1.1 推荐书籍
官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具
官网 http://www.numpy.org/ 功能:一个常用的科学计算库;
官网 https://matplotlib.org/ 功能:一个二维图像绘制库;
官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;
一、 定义
一、 介绍
一、 词法
前导知识:(懂程序设计基础,面向对象程序设计更好)
用来执行多条命令;
会用基本挂载命令;
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程
视频业务相关企业
从视频中解出图像;
视频相关研究员
相关资料:图片描述资源汇总
实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;
视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述
相关资料:视频检索资源汇总 · 图片检索概述
video inpaint
视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...
相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源
video localization
诸多视频分析技术都是以关键帧提取作为基础,在此就做一个汇总; 相关资源:关键帧提取概述
shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...
相关资源:目标检测资源
ICLR 2019 论文发表时间:2018-10-01 作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学) 论文地址:https://arxiv.org/abs/1810.04511
ICLR 2016 论文发表时间:2015-11-12 作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov 单位:Department of Computer Science, University of Toronto 论文地址:...
video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;
shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg
官网: https://www.zotero.org
linux 下 vpn 工具配置
关于使用 TeXt theme 时,想要实现文章分类显示的办法;主要思路是使用 head + 导航页面 + 文章分类的功能;
官网: https://clang.llvm.org/
官网
目前 HistCite 只有 Windows 版本,不支持 macOS 系统;
http://feed43.com/
2013 年 3 月:Docker 正式发布开源版本 官网:https://docs.docker.com/ 中文教程:http://www.docker.org.cn/ docker hub:https://www.docker.com/ nvidia-docker github:https://gith...
论文发表时间:2019-03-13 作者:Zhengxia Zou (1), Zhenwei Shi (2), Yuhong Guo (3 and 4), Jieping Ye (1 and 4) ((1) University of Michigan, (2) Beihang Un...
论文发表时间:2018-09-06,IJCV 2018 作者:Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 论文地址:https://a...
论文发表时间:2019-07-11 作者:Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu 论文地址:https://arxiv.org/abs/1907.09...
论文发表时间:2018-07-15 作者:Zhong-Qiu Zhao, Peng Zheng, Shou-tao Xu, Xindong Wu 论文地址:https://arxiv.org/abs/1807.05511
视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...
ICLR 2019 论文发表时间:2018-10-01 作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学) 论文地址:https://arxiv.org/abs/1810.04511
ICLR 2016 论文发表时间:2015-11-12 作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov 单位:Department of Computer Science, University of Toronto 论文地址:...
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
论文发表时间:2018年07月15日 论文:https://arxiv.org/abs/1807.05520
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
https://arxiv.org/list/cs/new
论文发表时间:2018年12月 论文地址:https://arxiv.org/abs/1812.01187 文章整理对比了CNN分类网络中常用的一些tricks,例如改善模型结构,训练过程的精修,包括修改损失函数、数据预处理等;
https://blog.csdn.net/dengbingfeng/article/details/51453851 https://zhuanlan.zhihu.com/p/33625603
使用 khadas 官方发布的 A311D NPU demo;
2021-01月份还在测试 npu 功能,由 tengine 发给 khadas,最终 khadas 释放出来;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门; 支持 Caffe/Tensorflow/Tflite/Darknet/Onnx/Keras/Pytroch 模型
2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...
商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;
百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...
2017-09-07 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...
2017-12-19 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef
阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS
腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...
TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....
mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...
检测行人和人体各部位; 通用目标检测资源
通用图像编辑资源
通用图像生成资源、风格迁移资源、季节变换资源、对抗生成网络资源
重识别资源汇总
pose estimation · action classification
通用图像修复资源
生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;
实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...
文章将简略介绍 GAN 中用到的深度学习概念;
过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;
用来执行多条命令;
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
多版本 API
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
训练简单
找到最适合自己的学单词方式,工具和方法在于精而不在多,将任何一种用到极致,都能创造惊喜;
一、 常见误区 想当然地使用默认的损失函数 一般情况下使用均方误差效果还行;但在现实应用中,需根据业务需求定制; 拿诈骗检测来说;为了达到业务目标,我们需按照与欺诈相关的美元金额的比例来惩罚假阴性以减少诈骗带来的损失; 效果 OK 与最好是两个概念;通用的损失函数,往往是 OK; 如何定制啊
每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;
Google Landmark Retrieval 2019: https://www.kaggle.com/c/landmark-retrieval-2019 2019.05.27 ~ 2019.06.10; CVPR 2019 标志建筑识别;
竞赛主页:https://competition.aihero100.com/
汇总常用竞赛网站
竞赛主页:https://challenge.rtcdeveloper.com/ai-in-rtc/ 赛道一(算法赛):AI in RTC-超分辨率图像质量比较挑战赛 赛道二(算法赛):AI in RTC-超分辨率算法性能比较挑战赛 赛道三(应用赛):【线上黑客马拉松】RTC编程挑战赛
竞赛主页:https://tianchi.aliyun.com/competition/entrance/231717/introduction
竞赛主页:https://www.kesci.com/home/competition/5d142d8cbb14e6002c04e14a/content
字符串匹配,可范化为序列匹配;
主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;
一、 介绍
视角转换:改变输入图像的视角; 本文汇总相关资源;
图1. 三维重建任务概览
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
多版本 API
多版本 API、OpenGL WIKI、OpenGLES2.0 API、GLES2.0 讲解博客
定义:定义一个操作中的算法的骨架,而将步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义算法的某些特定步骤。【抽象类】——基于继承的代码复用技术
replace FIFO_RepIaceAIgorithm ReplaceO ReplaceAIgorithm «abstract» ReplaceO LRU_RepIaceAIgorithm ReplaceO Cache algorithm CacheO —Cache() ReplaceO Random_Rep...
背景:类的行为是随着它的状态改变的而改变
单例模式 和 MONOSTATE
定义:定义了对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都
一、 学习目标 理解松耦合设计思想 掌握面向对象设计原则 掌握重构技巧 掌握核心设计模式
背景:不必改变原类文件和使用继承的情况下,动态的扩展一个对象的的功能。 方案:利用子对象,委派
抽象工厂
官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具
官网 http://www.numpy.org/ 功能:一个常用的科学计算库;
官网 https://matplotlib.org/ 功能:一个二维图像绘制库;
官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;
目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;
目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态
目标检测资源
论文发表时间:2019-03-13 作者:Zhengxia Zou (1), Zhenwei Shi (2), Yuhong Guo (3 and 4), Jieping Ye (1 and 4) ((1) University of Michigan, (2) Beihang Un...
论文发表时间:2018-09-06,IJCV 2018 作者:Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 论文地址:https://a...
论文发表时间:2019-07-11 作者:Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu 论文地址:https://arxiv.org/abs/1907.09...
论文发表时间:2018-07-15 作者:Zhong-Qiu Zhao, Peng Zheng, Shou-tao Xu, Xindong Wu 论文地址:https://arxiv.org/abs/1807.05511
参考源码: https://github.com/chuanqi305/MobileNet-SSD 环境: https://github.com/weiliu89/caffe/tree/ssd
目标检测概述
通用目标检测资源、GAN 资源、自编码器资源
通用物体分类资源
对抗生成网络资源、通用图像生成资源、风格迁移资源、人脸生成资源
通用物体分割资源
通用物体分割资源
通用物体分割资源
通用物体分割资源
视频业务相关企业
视频相关研究员
实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;
相关资料:视频检索资源汇总 · 图片检索概述
相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源
腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home
阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....
视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...
ICLR 2019 论文发表时间:2018-10-01 作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学) 论文地址:https://arxiv.org/abs/1810.04511
ICLR 2016 论文发表时间:2015-11-12 作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov 单位:Department of Computer Science, University of Toronto 论文地址:...
video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;
通用物体分类资源,通用目标检测资源,自动驾驶资源
优化器资源
反向传播的实质是链式求导
attention
Batch Normalization,Layer Normalizaiton,Instance Normalization,Group Normalization,Switchable Normalization
「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...
linux 下 vpn 工具配置
目前 HistCite 只有 Windows 版本,不支持 macOS 系统;
命令分类 命令 Docker 环境信息 info,version 容器生命周期管理 creat,exec,kill,pause,restart,rm,run,start,s...
2013 年 3 月:Docker 正式发布开源版本 官网:https://docs.docker.com/ 中文教程:http://www.docker.org.cn/ docker hub:https://www.docker.com/ nvidia-docker github:https://gith...
数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;
在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;
也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述
相关资料:图片检索概述、视频检索资源 · 音频检索资源
https://blog.csdn.net/dengbingfeng/article/details/51453851 https://zhuanlan.zhihu.com/p/33625603
使用 khadas 官方发布的 A311D NPU demo;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门; 支持 Caffe/Tensorflow/Tflite/Darknet/Onnx/Keras/Pytroch 模型
训练数据不包含标注信息的情况下完成目标任务; 表示学习资源
论文发表时间:2018年07月15日 论文:https://arxiv.org/abs/1807.05520
源码:https://github.com/opencv/opencv docs:https://docs.opencv.org
交通场景中分割出车辆; 通用物体分割资源
找到不同交通场景中的同一个车辆; 图片检索资源、车辆分割资源、车辆检测资源
通用目标检测资源,自动驾驶资源
车辆相关属性识别; 物体分类资源
数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;
在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;
使用 khadas 官方发布的 A311D NPU demo;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门;
A311D NPU 原生 SDK 入门; 支持 Caffe/Tensorflow/Tflite/Darknet/Onnx/Keras/Pytroch 模型
关于使用 TeXt theme 时,想要实现文章分类显示的办法;主要思路是使用 head + 导航页面 + 文章分类的功能;
http://feed43.com/
CNN
论文发表时间:2018年12月 论文地址:https://arxiv.org/abs/1812.01187 文章整理对比了CNN分类网络中常用的一些tricks,例如改善模型结构,训练过程的精修,包括修改损失函数、数据预处理等;
又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;
又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;
图1. 三维重建任务概览
模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)
模型量化概述
竞赛主页:https://tianchi.aliyun.com/competition/entrance/231717/introduction
参考源码: https://github.com/chuanqi305/MobileNet-SSD 环境: https://github.com/weiliu89/caffe/tree/ssd
腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...
识别从未见过的数据类别,使模型具有知识迁移的能力;
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程
功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg
TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....
ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法
相关资源:深度估计资源
深度估计:根据单张图像得到深度图; 深度估计概述
自编码相关资源;
shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...
shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection
源码:https://github.com/opencv/opencv docs:https://docs.opencv.org
主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;
让你能够跑通地一个 qss 项目;
视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述
诸多视频分析技术都是以关键帧提取作为基础,在此就做一个汇总; 相关资源:关键帧提取概述
相关资源:对抗攻击资源
相关资源:对抗攻击概述
计算两个序列的相似度,可找到两者公共的部分,可带容错; 字符串匹配
识别出不匹配预期模式或数据;异常也被称为离群值、新奇、噪声、偏差和例外;
Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...
光学字符识别;感觉在 2017 年爆炸了; 相关资源:目标检测资源
2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...
官网: https://clang.llvm.org/
2021-01月份还在测试 npu 功能,由 tengine 发给 khadas,最终 khadas 释放出来;
论文发表时间:2018年12月 论文地址:https://arxiv.org/abs/1812.01187 文章整理对比了CNN分类网络中常用的一些tricks,例如改善模型结构,训练过程的精修,包括修改损失函数、数据预处理等;
排名不分先后
每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;
一、 介绍
附录 A 资料
mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...
视角转换:改变输入图像的视角; 本文汇总相关资源;
智能算法在没有人为指导的情况下,通过不断的试错来提升任务性能的过程;
给出可以摆放物体的位置;
通用图像修复资源
pose estimation · action classification
重识别资源汇总
FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;
相关资源:目标检测资源
顶会论文于业界常常具有导向作用;
通用物体分割资源
通用物体分割资源
训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源
训练简单
根据输入的文字找到图片中的物体; 通用目标检测资源,通用物体分割资源
video localization
车辆相关属性识别; 物体分类资源
video inpaint
识别出不匹配预期模式或数据;异常也被称为离群值、新奇、噪声、偏差和例外;
扩大图像的分辨率,获得清晰画质;在医疗和卫星成像上有着重要应用;
通用目标检测资源,自动驾驶资源
相关资料:视频检索资源 · 图像检索资源
阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....
腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home
阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS
2017-12-19 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef
2017-09-07 Facebook、微软联合推出的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...
百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...
商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;
通用图像生成资源、风格迁移资源、季节变换资源、对抗生成网络资源
通用图像编辑资源
找到产品中的瑕疵区域;
找到产品中的瑕疵区域;
找到不同交通场景中的同一个车辆; 图片检索资源、车辆分割资源、车辆检测资源
交通场景中分割出车辆; 通用物体分割资源
通用物体分类资源,通用目标检测资源,自动驾驶资源
检测行人和人体各部位; 通用目标检测资源
通用物体分割资源
通用物体分割资源
通用物体分割资源
字符串匹配,可范化为序列匹配;
计算两个序列的相似度,可找到两者公共的部分,可带容错; 字符串匹配
从视频中解出图像;
对抗生成网络资源、通用图像生成资源、风格迁移资源、人脸生成资源
替换掉图像中的某些物件或部位;
修补图像中少量的缺失;
比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;
通用图像生成资源、人脸生成资源、季节变换资源、对抗生成网络资源 style transfer
通用物体分类资源
一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;
已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;
又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源
通用目标检测资源、GAN 资源、自编码器资源
social_good
「AI」 社会公益资源汇总
less than 1 minute read