类别

AI

「CV」 目标检测:FPN

1 minute read

目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;

「CV」 目标检测 Trick

less than 1 minute read

目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态

「CV」 ROC 和 PR 曲线

less than 1 minute read

ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法

「DL」 Pytorch 模型量化

less than 1 minute read

模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)

「DL」 表示学习资源汇总

less than 1 minute read

又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源

「DL」 弱监督学习资源汇总

less than 1 minute read

已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;

「DL」 多示例学习资源汇总

less than 1 minute read

一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;

「CV」 图像补全资源汇总

less than 1 minute read

比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;

「Video」 ffmpeg 入门

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程

「CV」 SynthText 数据集

2 minute read

Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...

「DLFramework」 TVM 入门

less than 1 minute read

2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...

「DLFramework」 PPL 介绍

less than 1 minute read

商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;

「DLFramework」 Paddle-Lite 入门

less than 1 minute read

百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...

「DLFramework」 ONNX 入门

less than 1 minute read

2017-09-07 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...

「DLFramework」 NNEF 入门

less than 1 minute read

2017-12-19 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef

「DLFramework」 MNN 入门

less than 1 minute read

阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS

「PROJECT」 VisionSeed 介绍

less than 1 minute read

腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home

「PROJECT」 VideoDNA 介绍

less than 1 minute read

阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....

「DLFramework」 NCNN 入门

less than 1 minute read

腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...

「CV」 图片检索概述

less than 1 minute read

也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述

「VIDEO」 特征提取概述

less than 1 minute read

实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;

「VIDEO」 关键帧提取概述

less than 1 minute read

视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述

「CV」 数字水印概述

2 minute read

数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;

「CV」 数字水印资源汇总

3 minute read

在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;

「竞赛」 2019 年 RTC 创新挑战赛

less than 1 minute read

竞赛主页:https://challenge.rtcdeveloper.com/ai-in-rtc/ 赛道一(算法赛):AI in RTC-超分辨率图像质量比较挑战赛 赛道二(算法赛):AI in RTC-超分辨率算法性能比较挑战赛 赛道三(应用赛):【线上黑客马拉松】RTC编程挑战赛

「论文解读」 Video Action Recognition Via Neural Architecture Searching

less than 1 minute read

视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...

「VIDEO」 视频检索资源汇总

13 minute read

相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源

「VIDEO」 视频摘要概述

1 minute read

shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...

「DL」 半监督学习资源汇总

less than 1 minute read

训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源

「DL」 联邦学习资源汇总

less than 1 minute read

FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;

「VIDEO」 视频分类概述

1 minute read

video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;

「VIDEO」 视频摘要资源汇总

less than 1 minute read

shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection

「DL」 生成模型简介

less than 1 minute read

生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;

「DL」 GAN 生成模型评估

1 minute read

实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...

「DL」 GAN 的应用

1 minute read

过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;

「DL」 卷积

1 minute read

「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...

「DLFramework」 TensorRT 入门

3 minute read

TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....

「DLFramework」 Mace 入门

less than 1 minute read

mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...

「Video」 ffmpeg 安装

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg

「ML」 机器学习中的常见误区

less than 1 minute read

一、 常见误区 想当然地使用默认的损失函数 一般情况下使用均方误差效果还行;但在现实应用中,需根据业务需求定制; 拿诈骗检测来说;为了达到业务目标,我们需按照与欺诈相关的美元金额的比例来惩罚假阴性以减少诈骗带来的损失; 效果 OK 与最好是两个概念;通用的损失函数,往往是 OK; 如何定制啊

「ML」性能度量

less than 1 minute read

每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;

人声提取

1 minute read

又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;

Back to Top ↑

CV

「CV」 目标检测:FPN

1 minute read

目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;

「CV」 目标检测 Trick

less than 1 minute read

目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态

「CV」 ROC 和 PR 曲线

less than 1 minute read

ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法

「CV」 图像补全资源汇总

less than 1 minute read

比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;

「CV」 SynthText 数据集

2 minute read

Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...

「CV」 图片检索概述

less than 1 minute read

也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述

「CV」 数字水印概述

2 minute read

数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;

「CV」 数字水印资源汇总

3 minute read

在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;

Back to Top ↑

software

「Python」 Visdom

less than 1 minute read

官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具

「算法」 分治

1 minute read

主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;

「Python」 Numpy

less than 1 minute read

官网 http://www.numpy.org/ 功能:一个常用的科学计算库;

「Python」 Matplotlib

less than 1 minute read

官网 https://matplotlib.org/ 功能:一个二维图像绘制库;

「Python」 eyeD3

less than 1 minute read

官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;

「Python」 类

1 minute read

前导知识:(懂程序设计基础,面向对象程序设计更好)

「设计模式」 模板方法

less than 1 minute read

定义:定义一个操作中的算法的骨架,而将步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义算法的某些特定步骤。【抽象类】——基于继承的代码复用技术

「设计模式」 策略模式

2 minute read

replace FIFO_RepIaceAIgorithm ReplaceO ReplaceAIgorithm «abstract» ReplaceO LRU_RepIaceAIgorithm ReplaceO Cache algorithm CacheO —Cache() ReplaceO Random_Rep...

「设计模式」 观察者模式

less than 1 minute read

定义:定义了对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都

「设计模式」 概览

less than 1 minute read

一、 学习目标 理解松耦合设计思想 掌握面向对象设计原则 掌握重构技巧 掌握核心设计模式

「设计模式」 装饰者模式

less than 1 minute read

背景:不必改变原类文件和使用继承的情况下,动态的扩展一个对象的的功能。 方案:利用子对象,委派

程序员推荐书籍

1 minute read

阅读这些书可以帮助你避免一些常见的陷阱和错误,一些开发人员早期经历的陷阱和犯过的错误;

Back to Top ↑

school

「En」 英语学习概述

less than 1 minute read

找到最适合自己的学单词方式,工具和方法在于精而不在多,将任何一种用到极致,都能创造惊喜;

Back to Top ↑

DL

「DL」 Pytorch 模型量化

less than 1 minute read

模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)

「DL」 表示学习资源汇总

less than 1 minute read

又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源

「DL」 弱监督学习资源汇总

less than 1 minute read

已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;

「DL」 多示例学习资源汇总

less than 1 minute read

一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;

「DL」 半监督学习资源汇总

less than 1 minute read

训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源

「DL」 联邦学习资源汇总

less than 1 minute read

FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;

「DL」 生成模型简介

less than 1 minute read

生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;

「DL」 GAN 生成模型评估

1 minute read

实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...

「DL」 GAN 的应用

1 minute read

过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;

「DL」 卷积

1 minute read

「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...

Back to Top ↑

python

「Python」 Visdom

less than 1 minute read

官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具

「Python」 Numpy

less than 1 minute read

官网 http://www.numpy.org/ 功能:一个常用的科学计算库;

「Python」 Matplotlib

less than 1 minute read

官网 https://matplotlib.org/ 功能:一个二维图像绘制库;

「Python」 eyeD3

less than 1 minute read

官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;

「Python」 类

1 minute read

前导知识:(懂程序设计基础,面向对象程序设计更好)

Back to Top ↑

linux

Back to Top ↑

video

「Video」 ffmpeg 入门

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程

「VIDEO」 特征提取概述

less than 1 minute read

实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;

「VIDEO」 关键帧提取概述

less than 1 minute read

视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述

「论文解读」 Video Action Recognition Via Neural Architecture Searching

less than 1 minute read

视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...

「VIDEO」 视频检索资源汇总

13 minute read

相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源

「VIDEO」 视频摘要概述

1 minute read

shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...

「VIDEO」 视频分类概述

1 minute read

video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;

「VIDEO」 视频摘要资源汇总

less than 1 minute read

shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection

「Video」 ffmpeg 安装

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg

Back to Top ↑

tool

TeXt theme 下实现文章分类

less than 1 minute read

关于使用 TeXt theme 时,想要实现文章分类显示的办法;主要思路是使用 head + 导航页面 + 文章分类的功能;

「工具」 Histcite

less than 1 minute read

目前 HistCite 只有 Windows 版本,不支持 macOS 系统;

「工具」 Docker 入门

2 minute read

2013 年 3 月:Docker 正式发布开源版本 官网:https://docs.docker.com/ 中文教程:http://www.docker.org.cn/ docker hub:https://www.docker.com/ nvidia-docker github:https://gith...

Back to Top ↑

c++

Back to Top ↑

paper_reading

「论文解读」 Video Action Recognition Via Neural Architecture Searching

less than 1 minute read

视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...

Back to Top ↑

dl_frameworks

「DLFramework」 TVM 入门

less than 1 minute read

2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...

「DLFramework」 PPL 介绍

less than 1 minute read

商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;

「DLFramework」 Paddle-Lite 入门

less than 1 minute read

百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...

「DLFramework」 ONNX 入门

less than 1 minute read

2017-09-07 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...

「DLFramework」 NNEF 入门

less than 1 minute read

2017-12-19 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef

「DLFramework」 MNN 入门

less than 1 minute read

阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS

「DLFramework」 NCNN 入门

less than 1 minute read

腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...

「DLFramework」 TensorRT 入门

3 minute read

TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....

「DLFramework」 Mace 入门

less than 1 minute read

mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...

Back to Top ↑

human

Back to Top ↑

GAN

「DL」 生成模型简介

less than 1 minute read

生成模型即能够产生同类型新数据的模型;可以根据输入产生我们所期望的输出;

「DL」 GAN 生成模型评估

1 minute read

实验发现,MMD 和 1-NN two-sample test 是最为合适的评价指标,这两个指标可以较好的区分真实样本和生成的样本, mode collapsing,且计算高效; 总体说来,GAN 的学习是一个无监督学习过程,所以很难找到一个比较客观的,可量化的评估指标;有许多指标在数值上虽然高,但是生...

「DL」 GAN 的应用

1 minute read

过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;

Back to Top ↑

pystl

Back to Top ↑

Shell

Back to Top ↑

parallel

Back to Top ↑

english

「En」 英语学习概述

less than 1 minute read

找到最适合自己的学单词方式,工具和方法在于精而不在多,将任何一种用到极致,都能创造惊喜;

Back to Top ↑

ML

「ML」 机器学习中的常见误区

less than 1 minute read

一、 常见误区 想当然地使用默认的损失函数 一般情况下使用均方误差效果还行;但在现实应用中,需根据业务需求定制; 拿诈骗检测来说;为了达到业务目标,我们需按照与欺诈相关的美元金额的比例来惩罚假阴性以减少诈骗带来的损失; 效果 OK 与最好是两个概念;通用的损失函数,往往是 OK; 如何定制啊

「ML」性能度量

less than 1 minute read

每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;

Back to Top ↑

grammer

Back to Top ↑

Competition

「竞赛」 2019 年 RTC 创新挑战赛

less than 1 minute read

竞赛主页:https://challenge.rtcdeveloper.com/ai-in-rtc/ 赛道一(算法赛):AI in RTC-超分辨率图像质量比较挑战赛 赛道二(算法赛):AI in RTC-超分辨率算法性能比较挑战赛 赛道三(应用赛):【线上黑客马拉松】RTC编程挑战赛

Back to Top ↑

algorithms

「算法」 分治

1 minute read

主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;

Back to Top ↑

cpp_foundation

Back to Top ↑

3D

Back to Top ↑

opengl

Back to Top ↑

design_pattern

「设计模式」 模板方法

less than 1 minute read

定义:定义一个操作中的算法的骨架,而将步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义算法的某些特定步骤。【抽象类】——基于继承的代码复用技术

「设计模式」 策略模式

2 minute read

replace FIFO_RepIaceAIgorithm ReplaceO ReplaceAIgorithm «abstract» ReplaceO LRU_RepIaceAIgorithm ReplaceO Cache algorithm CacheO —Cache() ReplaceO Random_Rep...

「设计模式」 观察者模式

less than 1 minute read

定义:定义了对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都

「设计模式」 概览

less than 1 minute read

一、 学习目标 理解松耦合设计思想 掌握面向对象设计原则 掌握重构技巧 掌握核心设计模式

「设计模式」 装饰者模式

less than 1 minute read

背景:不必改变原类文件和使用继承的情况下,动态的扩展一个对象的的功能。 方案:利用子对象,委派

Back to Top ↑

library

「Python」 Visdom

less than 1 minute read

官网 https://github.com/facebookresearch/visdom Facebook专门为PyTorch开发的一款可视化工具

「Python」 Numpy

less than 1 minute read

官网 http://www.numpy.org/ 功能:一个常用的科学计算库;

「Python」 Matplotlib

less than 1 minute read

官网 https://matplotlib.org/ 功能:一个二维图像绘制库;

「Python」 eyeD3

less than 1 minute read

官方文档 http://eyed3.nicfit.net/ 功能:用来处理 MP3 文件;

Back to Top ↑

NLP

Back to Top ↑

detection

「CV」 目标检测:FPN

1 minute read

目标检测资源、目标检测概述 本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;

「CV」 目标检测 Trick

less than 1 minute read

目标检测资源、目标检测概述 模型的调参训练技巧其实说白了就是怎么让模型得到的是数据全集的稀疏分布,且和别的类别有比较好的区分,也就是类内差小类间差则尽量大;以这个为核心,告诉模型应该关注什么,少关注什么,既然是数据的科学,多关注数据的分布和呈现的状态

Back to Top ↑

nature

Back to Top ↑

video_retrieval

「VIDEO」 特征提取概述

less than 1 minute read

实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;

「VIDEO」 视频检索资源汇总

13 minute read

相似视频检索: 相似指的是通过修改原视频的到新的视频; 相关资料:检索概述 · 图像检索资源 · 音频检索资源

Back to Top ↑

project

「PROJECT」 VisionSeed 介绍

less than 1 minute read

腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home

「PROJECT」 VideoDNA 介绍

less than 1 minute read

阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....

Back to Top ↑

video_classification

「论文解读」 Video Action Recognition Via Neural Architecture Searching

less than 1 minute read

视频动作识别:在工业和学术界都是热点,因为这对于行为分析和情感计算等应用的基础;虽然目前该领域的数据集和神经网络都有着很大进步,但是这需要耗费大量的时间和专家; 视频任务对于时间和空间的需求决定了网络结构复杂和较高的计算代价; 神经网络自动搜索:Neural Architecture Search(...

「VIDEO」 视频分类概述

1 minute read

video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;

Back to Top ↑

traffic

Back to Top ↑

foundation

「DL」 卷积

1 minute read

「卷积」通常是「参数共享卷积」的简称;且该卷积与数学中的卷积操作不是一个概念; 除了图像和视频等处于欧几里得空间的数据之外,更多的数据是处于非欧几里得空间的,例如社交网络中的关系数据、三维点云数据、分子结构数据、基因数据和交通数据等等;由于这些数据的无序性和维度的可变性,使得传统卷积很难应用其中; 当...

Back to Top ↑

linear_algebra

Back to Top ↑

worktool

「工具」 Histcite

less than 1 minute read

目前 HistCite 只有 Windows 版本,不支持 macOS 系统;

「工具」 Docker 常用命令

1 minute read

命令分类 命令 Docker 环境信息 info,version 容器生命周期管理 creat,exec,kill,pause,restart,rm,run,start,s...

「工具」 Docker 入门

2 minute read

2013 年 3 月:Docker 正式发布开源版本 官网:https://docs.docker.com/ 中文教程:http://www.docker.org.cn/ docker hub:https://www.docker.com/ nvidia-docker github:https://gith...

Back to Top ↑

security

「CV」 数字水印概述

2 minute read

数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;

「CV」 数字水印资源汇总

3 minute read

在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;

Back to Top ↑

retrieval

「CV」 图片检索概述

less than 1 minute read

也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述

Back to Top ↑

advanced

Back to Top ↑

stl

Back to Top ↑

AI_

Back to Top ↑

python_tool

Back to Top ↑

a311d

Back to Top ↑

audio

Back to Top ↑

elementary

「Python」 类

1 minute read

前导知识:(懂程序设计基础,面向对象程序设计更好)

Back to Top ↑

unsupervised

Back to Top ↑

paper

Back to Top ↑

point_cloud

Back to Top ↑

CNN

Back to Top ↑

opencv

Back to Top ↑

vehicle

Back to Top ↑

digital_watermarking

「CV」 数字水印概述

2 minute read

数字水印是在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中,以达到版权保护等作用;如果没有稳健性的要求,水印与信息隐藏技术的处理本质上是完全一致的;

「CV」 数字水印资源汇总

3 minute read

在不影响数字载体(包括多媒体——图片、视频、音频,文档,软件等)使用价值的情况下,将标识信息嵌入到载体中; 数字水印侧重于水印信息的鲁棒性,隐写侧重中水印信息的隐蔽性;

Back to Top ↑

aml

Back to Top ↑

blog

TeXt theme 下实现文章分类

less than 1 minute read

关于使用 TeXt theme 时,想要实现文章分类显示的办法;主要思路是使用 head + 导航页面 + 文章分类的功能;

Back to Top ↑

classification

Back to Top ↑

g_foundation

程序员推荐书籍

1 minute read

阅读这些书可以帮助你避免一些常见的陷阱和错误,一些开发人员早期经历的陷阱和犯过的错误;

Back to Top ↑

Audio

人声提取

1 minute read

又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;

Back to Top ↑

VoiceprintAnalysis

人声提取

1 minute read

又叫人声分离/割(speaker diarization); 目的:基于声纹特征的方式将不同说话人的声音分离出来;

Back to Top ↑

voiceprint_analysis

Back to Top ↑

reconstruction

Back to Top ↑

2.5D

Back to Top ↑

image_process

Back to Top ↑

compression

「DL」 Pytorch 模型量化

less than 1 minute read

模型量化概述、权值量化论文汇总 量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net)

Back to Top ↑

agriculture

Back to Top ↑

multimodal

Back to Top ↑

paper_practice

Back to Top ↑

ncnn

「DLFramework」 NCNN 入门

less than 1 minute read

腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, ...

Back to Top ↑

qt_tool

Back to Top ↑

device

Back to Top ↑

meta_learning

Back to Top ↑

ml_classify

Back to Top ↑

tree

Back to Top ↑

pytorch

Back to Top ↑

leetcode

Back to Top ↑

video_library

「Video」 ffmpeg 入门

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg 安装教程

「Video」 ffmpeg 安装

less than 1 minute read

功能:跨平台的音视频处理库; 官网 https://www.ffmpeg.org/ github:https://github.com/FFmpeg/FFmpeg

Back to Top ↑

dimention_reduction

Back to Top ↑

tensorrt

「DLFramework」 TensorRT 入门

3 minute read

TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia....

Back to Top ↑

ensemble_learning

Back to Top ↑

body_landmark

Back to Top ↑

greedy

Back to Top ↑

skill

Back to Top ↑

cv_foundation

「CV」 ROC 和 PR 曲线

less than 1 minute read

ROC曲线和PR(Precision - Recall)曲线皆为类别不平衡问题中常用的评估方法

Back to Top ↑

depth_prediction

Back to Top ↑

Linux

Back to Top ↑

autoencoder

Back to Top ↑

video_summary

「VIDEO」 视频摘要概述

1 minute read

shot detection · key frame detection · video summary video abstract · video synopsis · video key frame extraction · video key clip extraction · video summa...

「VIDEO」 视频摘要资源汇总

less than 1 minute read

shot detection · video summary · video synopsis · video key clip extraction · video summarization · key frame Detection

Back to Top ↑

opencv_introduction

Back to Top ↑

divide_conquer

「算法」 分治

1 minute read

主要思想是解决小问题比解决大问题容易;于是将问题分解成若干子问题,然后用同样的方法求解子问题;最后将子问题的解合并,就得到问题的解; 二分查找就是分治思想的一种应用;

Back to Top ↑

office

Back to Top ↑

qt

Back to Top ↑

life

Back to Top ↑

reading

Back to Top ↑

r_recommend

Back to Top ↑

key_frame

「VIDEO」 关键帧提取概述

less than 1 minute read

视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述

Back to Top ↑

adversarial_attack

Back to Top ↑

data_mining

Back to Top ↑

ocr

「CV」 SynthText 数据集

2 minute read

Synthetic Data for Text Localisation in Natural Images (CVPR 2016-04-22) paper: https://arxiv.org/abs/1604.06646 github: https://github.com/ankush-m...

Back to Top ↑

auto_drive

Back to Top ↑

video_caption

Back to Top ↑

opencv_core

Back to Top ↑

tvm

「DLFramework」 TVM 入门

less than 1 minute read

2016-10-13 陈天奇开源的移动端 DL 推理框架,已与 NNVM 合并; github: https://github.com/dmlc/tvm 官网: https://tvm.ai/ 文档: https://docs.tvm.ai/ 论文: https://arxiv.o...

Back to Top ↑

git

Back to Top ↑

cuda

Back to Top ↑

clang

Back to Top ↑

career

Back to Top ↑

interview

Back to Top ↑

pcl_registration

Back to Top ↑

tengine

Back to Top ↑

caffe

Back to Top ↑

MLOptimization

Back to Top ↑

cv_company

Back to Top ↑

parallel_cpp

Back to Top ↑

model_evaluation

「ML」性能度量

less than 1 minute read

每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;

Back to Top ↑

OOP

Back to Top ↑

FeatureEngineering

Back to Top ↑

disjoint_set

Back to Top ↑

mace

「DLFramework」 Mace 入门

less than 1 minute read

mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoM...

Back to Top ↑

image_generation

Back to Top ↑

view_synthesis

Back to Top ↑

RL

Back to Top ↑

affordance

Back to Top ↑

segmentation

Back to Top ↑

activity_recognization

Back to Top ↑

apparent_analysis

Back to Top ↑

crowd_counting

Back to Top ↑

face_align

Back to Top ↑

face_recognization

Back to Top ↑

face_verification

Back to Top ↑

facial_inpaint

Back to Top ↑

gesture_recognition

Back to Top ↑

lip_reading

Back to Top ↑

pose_estimation

Back to Top ↑

human_reid

Back to Top ↑

human_segmentation

Back to Top ↑

video_super_resolution

Back to Top ↑

modern

Back to Top ↑

traffic_analysis

Back to Top ↑

traffic_event_analysis

Back to Top ↑

data_augementation

Back to Top ↑

gait_recognition

Back to Top ↑

automl

Back to Top ↑

federated_learning

「DL」 联邦学习资源汇总

less than 1 minute read

FTL:为了应对数据隐私的挑战,最近出现了联邦学习的概念;联邦学习将各团体独立的数据统一管辖,彼此之间在不互通数据的情况下就可以获得模型效果的提升;其核心是各个企业的自有数据不出本地,模型效果不变;

Back to Top ↑

RNN

Back to Top ↑

video_detection

Back to Top ↑

meeting

Back to Top ↑

medical

Back to Top ↑

nature_foundation

Back to Top ↑

color_enhancement

Back to Top ↑

semi_supervised

「DL」 半监督学习资源汇总

less than 1 minute read

训练数据中只有一小部分具有标签,根据训练数据完成训练;这种情况常常是因为数据标注困难,比如医疗诊断; 表示学习资源

Back to Top ↑

transfer_learning

Back to Top ↑

writing

Back to Top ↑

label_tool

Back to Top ↑

VQA

Back to Top ↑

video_localization

Back to Top ↑

weixin

Back to Top ↑

tracking

Back to Top ↑

multimodal_fusion

Back to Top ↑

capsnet

Back to Top ↑

eye_gaze_tracking

Back to Top ↑

vehicle_recognition

Back to Top ↑

video_inpaint

Back to Top ↑

anomaly_detect

Back to Top ↑

super_resolution

Back to Top ↑

vehicle_detect

Back to Top ↑

audio_retrieval

Back to Top ↑

cpp_blas

Back to Top ↑

gtest

Back to Top ↑

video_generation

Back to Top ↑

la_determinant

Back to Top ↑

la_eigen

Back to Top ↑

la_equation

Back to Top ↑

la_matrix

Back to Top ↑

la_quadratic_form

Back to Top ↑

la_vector

Back to Top ↑

video_retrieval_pro

「PROJECT」 VideoDNA 介绍

less than 1 minute read

阿里云视频 DNA 应用场景: https://help.aliyun.com/document_detail/93562.html 操作步骤: https://help.aliyun.com/document_detail/93552.html DNA 接口: https://help....

Back to Top ↑

face_recognize_pro

「PROJECT」 VisionSeed 介绍

less than 1 minute read

腾讯优图推出的人脸识别的模块,基于 ncnn 库,串口输出,有红外活体,提供 1:N 识别能力,还有数据可视化和人脸库管理功能; 主页: https://visionseed.youtu.qq.com/#/home

Back to Top ↑

mnn

「DLFramework」 MNN 入门

less than 1 minute read

阿里开源的移动端 DL 推理框架; github: https://github.com/alibaba/MNN 支持框架: tensoflow, onnx(pytorch), caffe 支持 OS: Android, iOS

Back to Top ↑

nnef

「DLFramework」 NNEF 入门

less than 1 minute read

2017-12-19 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/KhronosGroup/NNEF-Tools 官网: https://www.khronos.org/nnef

Back to Top ↑

onnx

「DLFramework」 ONNX 入门

less than 1 minute read

2017-09-07 Facebook、微软联合推出​的一个开放标准,旨在不同框架之间完成互操作;着力于结果模型的转化; github: https://github.com/onnx/onnx 官网: http://onnx.ai/supported-tools 文档: https:...

Back to Top ↑

paddle_lite

「DLFramework」 Paddle-Lite 入门

less than 1 minute read

百度开源; github: https://github.com/PaddlePaddle/Paddle-Lite X2Paddle: https://github.com/PaddlePaddle/X2Paddle 支持平台: ARM, OpenCL, NPU; 支持框架: Paddl...

Back to Top ↑

ppl

「DLFramework」 PPL 介绍

less than 1 minute read

商汤自研的闭源 DL 推理框架; 支持的芯片架构: ARMv7,ARMv8,x86和GPU; 支持的OS: Linux,Windows,MacOS,iOS 和 Android;

Back to Top ↑

openmp

Back to Top ↑

vulkan

Back to Top ↑

spider

Back to Top ↑

image_deblur

Back to Top ↑

face_generation

Back to Top ↑

facial_attribute_editing

Back to Top ↑

fitting_room

Back to Top ↑

makeup

Back to Top ↑

industry

Back to Top ↑

defect_inspection

Back to Top ↑

driver_analysis

Back to Top ↑

cv_sentiment_analysis

Back to Top ↑

vehicle_reid

Back to Top ↑

vehicle_segmentation

Back to Top ↑

traffic_intention_analysis

Back to Top ↑

traffic_signals_recognition

Back to Top ↑

image_caption

Back to Top ↑

action_retarget

Back to Top ↑

human_detection

Back to Top ↑

earthquake

Back to Top ↑

fire_disaster

Back to Top ↑

salt_bodies

Back to Top ↑

sky

Back to Top ↑

typhoon

Back to Top ↑

GCN

Back to Top ↑

graph

Back to Top ↑

image-blend

Back to Top ↑

manipulated_detect

Back to Top ↑

string

Back to Top ↑

sequence_alignment

Back to Top ↑

probability

Back to Top ↑

video_decode

Back to Top ↑

season_translation

Back to Top ↑

ios

Back to Top ↑

ui_foundation

Back to Top ↑

intelligent_production_pro

Back to Top ↑

marketing_pro

Back to Top ↑

intelligent_education_pro

Back to Top ↑

intelligent_storage_pro

Back to Top ↑

optimal_schedule_pro

Back to Top ↑

order_match_pro

Back to Top ↑

intelligent_medical_pro

Back to Top ↑

optical_flow

Back to Top ↑

SLAM

Back to Top ↑

calibration

Back to Top ↑

visual_odometry

Back to Top ↑

image_edit

Back to Top ↑

image_inpaint

Back to Top ↑

image_outpaint

「CV」 图像补全资源汇总

less than 1 minute read

比图像修复更进一步,能从一个图像片段“推断”出外延的部分,补全成整个画面;是斯坦福大学 CS230 课程中 Mark Sabini 的期末作品;

Back to Top ↑

style_transfer

Back to Top ↑

biological

Back to Top ↑

multi_instance

「DL」 多示例学习资源汇总

less than 1 minute read

一组数据共用一个标签,模型负责预测一组数据的标签或预测出单条数据的标签:其中一组数据被称为数据包;比如一段视频只做一个分类标记;

Back to Top ↑

weakly_supervised

「DL」 弱监督学习资源汇总

less than 1 minute read

已知弱标签,去学习强标签的问题:标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,检测的标签就是弱标签;想对于检测,分类就是弱标签;例如已知一幅图上有一只猫,那么找到猫在哪里的过程就是标签提升——弱监督问题;

Back to Top ↑

representation

「DL」 表示学习资源汇总

less than 1 minute read

又叫「特征嵌入」,使用模型学习到输入数据的低维表示——特征,然后可以将其应用于各种任务; 无监督学习资源

Back to Top ↑

machine_translation

Back to Top ↑

security_screening

Back to Top ↑

financial

Back to Top ↑

social_good

Back to Top ↑

computer_security

Back to Top ↑

question_answering

Back to Top ↑

reading_comprehension

Back to Top ↑

underwater_image

Back to Top ↑

nano

Back to Top ↑

captcha

Back to Top ↑

curb_detection

Back to Top ↑

salient

Back to Top ↑

rockchip

Back to Top ↑

autodrive

Back to Top ↑

slam

Back to Top ↑

transformer

Back to Top ↑

bio_metric

Back to Top ↑

palm_print

Back to Top ↑