身份证识别系统搭建

Day 2 - 身份证识别系统搭建

身份证识别功能描述

RecognizeIdentityCard可以识别二代身份证关键字段内容,关键字段包括:姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可输出身份证区域位置和人脸位置信息。

输入限制

  • 图片格式:JPEG、JPG、PNG、BMP、GIF。
  • 图像大小:图像大小不超过3M。
  • 图像分辨率:不限制图片分辨率,但图片分辨率太高可能会导致API识别超时,超时时间为5秒。
  
 AI

电子相册搭建

电子相册搭建(人脸、表情识别)

表情识别功能描述

RecognizeExpression可以检测和识别图片中人脸的表情。表情种类为:neutral(中性)、happiness(高兴)、surprise(惊讶)、sadness(伤心)、anger(生气)、disgust(厌恶)、fear(害怕)。

输入限制

  • 图片分辨率:分辨率要求大于5×5像素。
  • 图片大小:图片大小不超过3M。
  • 人脸尺寸:建议大于64×64像素。

  

视觉生产技术

视觉生产技术

定义和分类

视觉生产定义

视觉生产就是通过一个/一系列视觉过程,产出新的视觉表达。这里的产出是指人或机器能够感知的图像视频,而不是标签或者特征并且必须是新的视觉表达,和输入的不一样。在过去,这个过程大多数是由人工来实现,但是现在我们希望通过AI技术,来产生一系列新的图像

视觉生产分类

  • 生成:从0到1
  • 拓展从1到N
  • 摘要:从N到1
  • 升维:从An到An+1
  • 增强/变换:从A到B
  • 插入/合成: A+B=C
  • 擦除: A-B=C
  

:D 一言句子获取中...