AI神经网络加速棒

 提示:点击图片可(kě)以放大

TPU是一款自主的、高性能(néng)的、通用(yòng)深度學(xué)习加速棒。同时支持X86平台、ARM平台、MIPS平台等主流平台的运行。内置CNN网络加速引擎,可(kě)以实现高性能(néng)、低功耗的CNN网络模型的加速。TPU架构设计先进,可(kě)以高效完成多(duō)路动态视频流的人脸检测、跟踪、特征提取和识别,高效支持墨镜、口罩、性别、年龄等属性检测。提供强大的可(kě)编程运算能(néng)力,满足CNN算法实时性处理(lǐ)的运算要求。芯片有(yǒu)自定义指令集和编程框架,除可(kě)运行人脸识别算法外,还支持其他(tā)主流的 CNN算法移植,包括服装识别、表情识别、背包识别等。同时也支持其他(tā)计算机视觉CNN 算法移植和应用(yòng)。

AI神经网络加速棒(图1)

AI神经网络加速棒(图2)

借助TPU,计算机视觉和人工智能(néng)可(kě)以轻松地部署到物(wù)联网和边缘设备上。无论开发者研发智能(néng)相机、无人机、工业机器人、智能(néng)家居设备或是实现边缘计算项目,TPU都能(néng)让原型设备运行得更加快速、更加智能(néng)。此外,借助TPU生态系统,开发者现在可(kě)以将他(tā)们的TPU原型移植到其他(tā)产品上,并实现设计的产品化。TPU的优点是不需要额外的硬件,因此用(yòng)户可(kě)以快速转换并将计算机训练模型无缝部署到各种各样的设备上,并且无需网络或云端连接。也就是说,开发者只要一台筆(bǐ)记本電(diàn)脑和TPU,仅需数分(fēn)钟就可(kě)以让其AI 应用(yòng)程序运转。

AI神经网络加速棒(图3)


TPU实现了深度學(xué)习异构计算,可(kě)以在标准的USB3.0串行通信口上进行计算机视觉与人工智能(néng)的推理(lǐ)加速。TPU支持多(duō)路图片和视频的编解码,并可(kě)以实现多(duō)路的视频和图片编解码。TPUAI加速核心共有(yǒu)4个,每个加速核心提供0.5TPOS的计算算力,并可(kě)以根据实际需求设定加速核心的个数从而调节TPU运行功率。TPU还支持目前AI领域的主流框架:MxnetTensorflowPytorch Caffe。在AI加速项目部署功能(néng)方面还支持Graph模式,以数据流的方式,提供跨平台(主控和TPU)的数据流水处理(lǐ)。Graph 提供直观的编程模式,支持json 配置文(wén)件创建,在主控端直接调用(yòng)TPU上的NodeClass 算子,大大提高解决方案设计效率。


这些强大的功能(néng)背后的实现依赖的是TPU上的强大的固件系统和稳定的硬件设备,通过标准的USB3.0接口把多(duō)路视频流或者图片传输到TPU上的主控芯片上,由TPU内部进行视频解码或者图片解码。使用(yòng)提供的desdk api进行基TPU的项目开发,由编译工具链把项目编译,完成后下载到固件系统上部 署,如设定好要使用(yòng)的加速算子、业務(wù)流程、调用(yòng)的加速核心数量、输入的图片大小(xiǎo)和模型等等,项目运行后就可(kě)以通过USB3.0端口进行数据交换,从而获得经过TPU加速计算后的数据。


处理(lǐ)器内核 : 

⚫ 32 位超高性能(néng)嵌入式 CPU 处理(lǐ)器; 

⚫ 支持 16/32 位混合编码的 RISC 指令集; 

⚫ L1 I/D 32KByte,L2 128KByte,主频最高支持 1.0GHz; 

⚫ 单位性能(néng)最高支持 2.5DMIPS/MHz; 

⚫ 支持大端和小(xiǎo)端模式; 

⚫ 支持 MMU,MMU 支持软件动态配置地址映射表; 

⚫ 内部硬件调试模块支持片上硬件调试; 

⚫ 支持内核省電(diàn)和动态频率调整等低功耗技术; 


神经网络处理(lǐ)器 NNP: 

⚫ 内含四核 NNP 神经网络处理(lǐ)器,主频最高支持 750Mhz;

⚫ 自定义神经网络处理(lǐ)器指令集和架构; 

⚫ 支持 INT16/INT12/INT8 数据类型; 

⚫ 支持 CNN 算法所需的指令集; 

⚫ 支持 weight 参数压缩; 

⚫ 支持 feature map 压缩; 

⚫ 支持 caffe/tensorflow/mxnet 等主流深度學(xué)习框架; 

⚫ 支持 Invasive 和 non-Invasive 的通用(yòng) Debug 架构; 

⚫ 支持处理(lǐ)器级联扩展、支持协处理(lǐ)器扩展; 

⚫ 时钟门控、電(diàn)源门控、多(duō)電(diàn)压等典型低功耗技术;


DSP 处理(lǐ)器 : 

⚫ 双核 Vision Processor DSP,主频最高支持 550Mhz; 

⚫ 32KB I-Cache/64KB ITCM/256KB DTCM; 

⚫ 支持小(xiǎo)端方式; 加速运算子 ACC : 

⚫ 支持色彩空间转换; 

⚫ 支持视频缩放; 

⚫ 支持梯度统计; 

⚫ 支持直方图统计; 

⚫ 支持 FFT 运算; 


视频解码 : 

⚫ 支持多(duō)路 H.264 解码,性能(néng)為(wèi) 4KP30;

⚫ 支持多(duō)路 H.265 解码,性能(néng)為(wèi) 4KP30,同时支持参考帧压缩功能(néng); 

⚫ 支持 I 帧/P 帧/B 帧解码; 

⚫ 支持 MPEG4/MPEG2/MPEG1 解码; 

⚫ 支持 JPEG 解码,解码 IMAGE SIZE 支持 48x48 to 16Kx16K; 

⚫ 支持 Clock gating 功能(néng); 

⚫ 支持 Powerdown 功能(néng); 


视频 JPEG 编码 : 

⚫ 支持 YCbCr4:2:0 Planar、YCbCr4:2:0 semi-planar、YCrCb4:2:0 semiplanar 格式输入; ⚫ 支持 RGB565、RGB888 和 RGB101010 格式输入; 

⚫ 支持输入图像分(fēn)辨率范围 96x32 to 8192x8192,像素尺寸步进為(wèi) 4; 

⚫ 支持 RGB to YCbCr4:2:0 色彩空间转换; 

⚫ 支持 YCbCr4:2:2 to YCbCr4:2:0 色彩空间转换; 

⚫ 支持 8Kx8K@2fps 编码性能(néng); 


MIPI CSI : 

⚫ 支持 MIPI CSI1.2 RX 4 Lane 输入接口,最高性能(néng)為(wèi) 4K30; 

⚫ 可(kě)支持的 YUV 数据类型:YUV420/YUV422,支持 8bit; 

⚫ 支持 RAW8 格式输入; 

⚫ 符合标准 MIPI CSI-2 协议 V1.2,向下兼容 V1.1 和 V1.0; 


USB : 

⚫ 支持 USB 3.0/USB 2.0 标准协议,支持 super-speed, high-speed, fullspeed, low-speed

⚫ 支持 HOST 模式、DEVICE 模式,HOST 和 DEVICE 模式可(kě)软件配置切换,在 上電(diàn)时配置切换, ⚫ 不支持使用(yòng)中动态切换; 

⚫ HOST 和 DEVICE 模式都支持协议规定的 CTRL/BULK/ISO/INTR 传输类型; 

⚫ 不支持 OTG 功能(néng); 


BT1120 : 

⚫ 支持 BT1120 视频输入接口,性能(néng)最高支持 1080p@60fps; 

⚫ 1 根时钟線(xiàn),16 根数据線(xiàn),数据传输只支持并口模式; 

⚫ 只支持逐行模式,支持典型的 720p/1080p 时序; 


 DDR : 

⚫ DDR4 支持最高速率 2667Mbps; 

⚫ 外接 DDR 2GByte; 

⚫ 支持 ODT 功能(néng); 

⚫ 支持 QOS 功能(néng); 

⚫ 支持动态 Training 功能(néng); 


芯片处理(lǐ)能(néng)力 : 

⚫ 芯片提供 2.0Tops 峰值算力:满足视觉 AI 算法实时性处理(lǐ)的运算要求; 

⚫ 支持每秒(miǎo)最大 1200 张人脸跟踪能(néng)力; 


其它说明 : 

⚫ 内含 2 个 Temp_sensor,支持功耗动态管理(lǐ); 

⚫ 支持版本在線(xiàn)升级;


Tag: AI
将此二维码图片分(fēn)享给朋友即可(kě)直达本页: