当前位置:首页 > 语音芯片
  • 探境科技:瞄准智能家居语音芯片实现百万级出货量

    探境科技:瞄准智能家居语音芯片实现百万级出货量

     探境科技副总裁李同治告诉机器之心,家电厂商可以直接使用这个电路板用语音交互来控制家电,比如代替抽油烟机原来需要按按键的操作,或者是将板卡与家电厂商的控制模块,通过串口协议直接相连,不做其它改变,即可升级为一套语音识别控制的智能家电。由 Marvell 中国芯片研发部门前高管鲁勇创立的 AI 芯片公司探境科技,想以此切入广阔的智能家居市场,通过语音芯片打开人机交互的入口。目前为止,搭载语音芯片的探境语音识别方案已实现百万级产品出货。今年营收已经破千万元。 在拥挤的语音 AI 芯片赛道,他们拥有自研的全栈式技术能力,先将目标瞄准智能家居市场,通过语音芯片打开人机交互的入口,再铺向更多的应用场景。正在播放电视剧的电视机旁,放着一个电路板,即内含探境科技的语音芯片——Voitist 音旋风 611、外围电路、麦克风,这是一个用于智能家居语音控制的原型系统。当人对着用于智能家居语音操控的原型系统说话时,该「系统」就会进行回应,它可以根据人的指令做出反馈,比如当你说出「最大风量」时,系统就会复述一句,将抽油烟机调整为最大风量。在夹杂多声源的语音环境下,离线不联网的语音控制系统仍能接听人发出的指令,并作出反馈。 实现百万级出货量 2017 年,担任 Marvell 中国芯片研发部门高管鲁勇看到了 AI 芯片热潮背后,存在着庞大的市场需求和落地场景,便创立了探境科技。两年时间,探境科技迅速实现芯片量产出货,且快速实现商业化落地。 2018 年,探境科技初步完成 SFA 架构雏形,实现语音芯片 Voitist 音旋风 611 的流片;2019 年第一季度 611 一次性流片成功,开始合作首个 alpha 客户,;2019 年中实现量产供货。2 年时间,鲁勇透露,搭载语音芯片的探境语音识别方案已实现百万级产品出货。未来探境还会将语音产品进行二次升级,推出更多在线离线一体化方案。截至目前,探境已经合作约 30 家机构,合作厂商包括美的、海尔等智能家居制造厂商。探境科技在全球有 6 个研发中心,分别是北京、上海、深圳、合肥、杭州、美国硅谷。公司总员工接近 200 人,其中 150 人是研发人员,其骨干研发人员平均工作经验约 15 年,其中有 50 人拥有硕士、博士学历。  三大「自研降噪」法宝:AI 降噪技术+HONN 神经网络+端到端双麦 在智能家居细分门类中,智能灯具、抽油烟机、空气净化器、垃圾桶、窗帘等家居设备,均可以通过搭载语音芯片的智能家居语音控制系统实现。据 Strategy Analytics 发布的研究报告显示,拥有语音控制的智能家居设备 (不包括智能音箱) 的销量将从 2018 年的 15.4 万台跃升至 2025 年的 3230 万台。在火热的智能家居语音市场,语音芯片在语音交互中扮演着一个关键的角色。因其在语音识别、智能交互等方面的优势,可以为智能家居提供新的控制入口。 但是目前语音控制技术层面仍面临诸多挑战。高噪声、远场识别环境造成低信噪比情况。信噪比,是衡量需要识别的目标声源与其它干扰声源强度比值的对数。一般将信噪比低于 15dB 的称为噪声环境。信噪比越低,识别难度越大。非稳态噪声,即干扰人们休息 、学习和工作的声音,也会对降噪算法产生影响。另外播放电视剧、音乐造成的多声源也会影响语音识别。在语音识别的研发过程中,一个完整的识别链路可以简化为麦克风输入、降噪处理、语音识别、识别结果输入四个环节。   语音识别研发流程 为了顺利完成语音识别,探境科技提出,首先在降噪处理方面下功夫,通过自研的 AI 降噪算法,对非稳态的突发性噪声进行过滤。其次,通过高计算强度神经网络(HONN)进行语音识别。在这一环节,神经网络模型所需的算力决定了模型的描述能力,同时也决定了模型处理能力和识别率的上限。 在传统的语音识别算法里,通常采用 DNN 的方法。DNN 即全连接神经网络,最朴素的神经网络,网络参数最多,计算量大。高强度神经网络的参数量不大,仅为 DNN 的五分之一,用更小的参数量和存储,即可实现更好的效果。相比较于全连接操作,卷积操作能够提供更高的计算强度,且卷积运算与人类大脑负责感知模块的处理方法类似,能够提取满足大脑认知的本质特征。探境将其计算机视觉中的一些经验迁移到语音识别中,在语音识别算法上加入了更多的卷积操作,重新设计了一个高计算强度的神经网络,即 HONN。结果显示,HONN 在远场和高噪声等环境下的识别率明显优于 DNN。基于 AI 降噪技术与 HONN 神经网络还不足以解决语音识别问题。为了提升超强噪音场景下的语音识别率,探境科技开发了基于 FCSP 的端到端 AI 双麦算法。FCSP(Frequency Complex Subspace Projection)是探境自研的频域复数子空间投影算法的简称。通过这个算法直接输入阵列信号,输出的是最终的识别结果,中间部分全部交给基于深度学习的 AI 算法来处理,不再使用传统的数字信号处理方法。 李同治表示,在模型训练期间,采取「注意力增强」的学习方法,能够灵敏地检测到唤醒词和命令词。「类似于在一个嘈杂的环境里面,如果有人喊自己的名字,一下子就能反应过来。」他比喻道。 探境科技的逻辑是,通过 AI 语音算法+HONN 神经网络模型来提升识别率,再通过 FCSP「端到端」的双麦处理算法简化识别流程,降低最终语音识别的错误率。将这三个「法宝」集结一体,目的是攻克语音识别难题。结合这三大条件,探境科技发布离在线一体的语音识别解决方案,即 Voitist 音旋风 612。Voitist 音旋风 612 的特点是降低传统语音设备对多麦的信号处理,相应节省硬件成本;在高噪声环境下识别率高;有效算力更高。  自研全栈式「硬底盘」 与其他公司不同,探境科技更强调自研,在全栈式技术上,提供芯片、软件、算法、系统一站式整体方案。存储优先的芯片架构 SFA(Storage First Architecture) 则成为探境科技搭建「全栈」式服务的基础。先用 SFA 解决算力的存储问题,再借助 AI 降噪算法,通过全栈式的解决方案「杀进」市场。 鲁勇表示,SFA 是针对 AI 芯片存储墙问题而设置的芯片架构。所谓存储墙问题指的是,与数据和存储相关的带宽瓶颈、功耗瓶颈问题。同行业其他 AI 芯片设计公司也意识到,AI 芯片的本质不是要解决计算问题,而是要解决数据问题。「所有运行的深度学习算法和 AI 芯片都面临一个问题,并不是要做卷积运算的乘法或加法,这并不是最难解决的问题,难点是在于存储带宽要求很大,存储功耗很高。」他指出,大量数据的重复使用,以及数据在存储器里的位置、相对关系、读取的性能,会影响到算法运行的性能。 目前常见的芯片类型 CPU、GPU、FPGA、ASIC 都可以运行深度学习算法,都可统称为 AI 芯片。CPU、GPU 都属于冯·诺依曼结构,指令译码执行、共享内存。用冯·诺依曼结构的处理器处理深度学习算法时,提供算力虽简单,但当运算部件达到一定的能力,存储器则无法跟上运算部件消耗的数据。因此,SFA 架构以存储来驱动计算,推翻冯·诺依曼架构,设计不同于之前类 CPU 的计算架构。     2019 年 8 月,探境自主研发的通用型语音芯片「音旋风」611,能够支持 200 条的命令词,能够做到 99% 的唤醒率和极低的误唤醒率,已切入智能家居领域,涉及智能空调、空气净化器等多个品类。另外,探境科技搭载的 SFA 架构的图像芯片 Imagist851 已流片成功,图像芯片的核心指标 IPS/W 高达 800,瞄准工业视觉、新零售、安防、辅助驾驶等市场。 鲁勇称,SFA 可实现真正的通用型 AI 芯片架构,可支持任意神经网络。「不仅适配于终端,也适配于云端、推理、训练,可组成不同类型的产品形态。」据鲁勇透露,探境的云端 AI 芯片也已提上日程,将于 2020 年推出。他向机器之心表示,现阶段会以智能家居为主基点,而后再逐渐加码至其他场景。 实测数据表明,在同等条件下,SFA 可带来超高的能效比,数据访问可降低 10~100 倍,存储子系统功耗下降 10 倍;28nm 工艺测试下,系统能效超过 4T OPS/W,计算资源利用率超过 80%,DDR 带宽占用率降低 5 倍。基于 SFA 架构,探境科技开辟语音和图像两条产品线。在探境科技的语音芯片产品矩阵中,除了支持 AI 双麦的 Voitist 音旋风 612 之外,还包括在离线一体的 Voitist 音旋风 621、以及语音芯片的旗舰产品——可支持本地 NLP 的音旋风 7 系列。 目前探境科技选择做终端 AI 芯片,相对云端芯片投入成本较低,离手机、智能音箱这类产品的设计和生产较近。在拥挤的语音 AI 芯片赛道,基于自研的全栈式技术能力,先解决存储再解决算力,探境走出一条不同寻常的路。谈及未来的发展规划,鲁勇表示,探境科技定位于一家语音、图像相结合的 AI 芯片公司,基于语音算法、图像算法,既有面向家具、玩具、智能穿戴等场景的语音系列解决方案,也有面向安防、新零售、辅助驾驶等图像解决方案。

    时间:2020-01-02 关键词: 智能家居 AI 语音芯片

  • 国内首款语音神经网络处理芯片

     2016年中国(成都)电子展参展商成都启英泰伦科技有限公司(Chipintelli Technology Co., Ltd.)宣布,该公司开发的中国首款智能语音神经网络处理芯片CI1006已测试成功,即将投入量产。该芯片采用启英泰伦公司自主知识产权的脑神经网络处理单元内核,可完美支持DNN(深度神经网络)架构,进行高性能的数据并行计算,可极大的提高人工智能深度学习语音技术对大量数据的处理效率,实现单芯片本地离线大词汇量识别等产品解决方案,可广泛应用于智慧家电、机器人、智慧玩具等产品领域。 据启英泰伦公司董事长何云鹏先生介绍,该公司目标是以自主的人工智能芯片计算架构和传感信息处理核心技术为基础,挖掘市场痛点及消费者潜在需求,针对人工智能市场领域提供具备超高性价比及超低功耗的专用智能芯片,让设备具有像人一样的感知,思考甚至情感能力,从而更好的为人类的生活服务。 CI1006智能语音神经网络处理芯片是该公司人工智能集成电路产品战略的第一个切入点:做人工智能的“耳朵”。该芯片采用QFN小型化封装,内置启英泰伦自主研发的BNPU(脑神经网络处理单元)内核,以及UART、I2C、SPI、PWM、红外等外围功能控制接口,集成度高,可为客户带来低成本及单一芯片的智能语音本地离线识别产品解决方案。同时,该芯片还可对接合作的云端及各种内容服务,满足客户的不同需求。“我们已经和行业知名的公司进行了合作,未来可迅速将使用我们芯片的产品推向千家万户”。在何云鹏看来,该芯片除了具备上述优势外,还具备非常强的可塑性。“我们已经引入了国内一流的语音算法团队,后续可以在语音识别交互及降噪方面,结合我们的芯片,将人工智能产品的体验感做到最优。我们的人工智能芯片是天然的硬件底层数据入口,未来还可以透过我们的芯片产品,为客户及消费者带来更多更好的增值服务。” 成都启英泰伦科技有限公司是一家专业的人工智能集成电路设计公司,其创始人及团队都是行业资深人士,具备多年成功的集成电路产品设计、量产及应用经验,同时具有广阔的产业链资源和人脉优势。该公司已在国内率先发布首款专用于智能语音的智能语音神经网络处理芯片,后续也将带来更多更优的人工智能专用芯片产品。 配图:     实物图片     何云鹏先生在展会现场照片  

    时间:2016-07-13 关键词: 语音芯片 神经网络架构

  • 基于SPI实现dsPlC与ISD语音芯片的通信设计

    概述: 在很多应用场合中,需要用到语音录放功能,如复读机、电话自动应答装置等。本文介绍一种简单实用的dsPIc数字信号控制器,用来完成语音录放功能。由于dsPIC强大的数字信号处理功能,可以提供后续的复杂处理等,具有良好的易扩展性。  介绍dsPIc数字信号控制器以厦ISD4002语音芯片的功能特点;特别介绍dsPIC的SPl库函数的功能及使用,并给出一种简单的语音录放电路。具有低成本、易使用等特点,有较高的实用价值。 1 dsPlC系列的简单介绍    dsPIC系列是Microchip公司推出的新型16位高性能数字信号控制器。它结合了单片机的控制优点及数字信号处理器(DSP)的高速运算特性,为嵌入式系统提供了单一芯片解决方案。它继承了PlC单片机系列的哈佛总线结构和精简指令集(RISC)技术,以及寻址方式简单、运行速度快、功耗低、驱动能力强等优点,同时集成了主板级的DSP功能,能够提供强大的数字信号处理能力;此外,还提供了如UART、CAN、SPI等丰富的外围接口,可以方便地与其他设备进行通信互联。本文介绍使用dsPIC数字信号控制器的SPI接口与ISD语音芯片进行通信控制,使用的芯片型号为dsPIc30F6014。2 ISD系列语音录放芯片    ISD系列语音芯片是美国ISD公司推出的产品。该系列芯片采用多电平直接模拟存储(Chip Corder)专利技术,声音不需要A/D转换和压缩,每个采样直接存储在片内的闪烁存储器中,避免了A/D转换的误差;能够真实、自然地还原语音、音乐及效果声;避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。ISD4000系列采用CM0s技术,内含晶体振荡器、防混叠滤波器、平滑滤波器、自动静噪、音频功率放大器及高密度多电平闪烁存储阵列等,只需要很少的外围器件即可构成一个完整的语音录放系统。它的操作命令通过串行通信接口(SPI)或Microwire送入;采样频率可为4.O Hz、5.3 Hz、6.4 Hz、8.O Hz,频率越低,录放时间越长,但音质会有所下降;片内信息存于闪烁存储器中,可在断电情况下保存100年(典型值),反复录音10万次;器件工作电压3 v,工作电流25~30 mA,音质好,适用于移动电话及其他便携式电子产品。本设计使用的芯片型号为ISD4002,单片录放时间为120 s。3 SPI接口介绍    SPI是由美国摩托罗拉公司推出的一种同步串行传输规范,常作为单片机外设芯片串行扩展接口。SPI有4个引脚:SS(从器件选择线)、SDO(串行数据输出线)、SDI(串行数据输入线)和SCK(同步串行时钟线)。SPI可以用全双工通信方式同时发送和接收8(16)位数据,过程如下:主机启动发送过程,送出时钟脉冲信号,主移位寄存器的数据通过SDO移入到从移位寄存器,同时从移位寄存器中的数据通过SDI移人到主移位寄存器中。8(16)个时钟脉冲过后,时钟停顿,主移位寄存器中的8(16)位数据全部移人到从移位寄存器中,随即又被自动装入从接收缓冲器中,从机接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。同理,从移位寄存器中的8位数据全部移入到主寄存器中,随即又被自动装入到主接收缓冲器中.主接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。主CPU检测到主接收缓冲器的满标志位或者中断标志位置1后,就可以读取接收缓冲器中的数据。同样,从CPU检测到从接收缓冲器满标志位或中断标志位置1后,就可以读取接收缓冲器中的数据,这样就完成了一次相互通信过程。这里设置dsPIC30F6014为主控制器,ISD4002为从器件,通过SPI口完成通信控制的过程。4 dsPIC的SPI函数库    dsPIC30F6014提供了2个SPI接口模块,每个接口模块包括三个特殊功能寄存器和四个引脚。SPIxBUF是数据缓冲寄存器。需要注意的是,接收缓冲SPIxRBF和发送缓冲SPIxTBF共享同一个地址,即它们都是地址映射到SPIxBUF的。也就是说,当对接收或发送缓冲寄存器操作时,都只能对SPIxBUF进行操作,而不能直接对SPIxRBF或SPIxTBF进行操作。SPIxCON是控制寄存器,用来对sPI模块的操作模式等进行配置;SPIxSTAT是状态寄存器,用来标示SPI模块所处的状态。其模块框图如图1所示。    通过对控制寄存器的配置,可以将SPI模块设置为8位或16位模式、主模式或从模式、帧同步等多种操作模式,还可以对时钟边沿、时钟分频倍数等进行配置。这里使用了以dsPIC为主,ISD为从的主从模式。Microchip提供的外围接口库可以方便地完成这些配置工作。    dsPIC Language Tools Libraries是MictoChip公司提供给开发者的一套工具库,其中主要含3个子库.DSP库,提供常用的DSP函数;外围接口库,提供对dsPIC系列所有外围接口的驱动函数,包括SPI接口;标准C及数学函数库,可在Microchip的官方网站下载(www.microchip. com)。我们使用其中的外围接口库中的SPI库函数即可。SPI库中主要包括以下几个函数:    ①configIntSPIx SPI中断配置函数。该函数可以对sPI接口的中断使能位以及中断优先级进行配置,返回值为空。    ②CloseSPlx关闭SPI接口。    ③DataRdySPlx SPl接口数据就绪。该函数用来判断SPI接收缓冲区中是否有数据等待读出。若返回值为1,表示缓冲区中数据已经就绪,等待读出;若返回值为0,则标示缓冲区为空。    ④ReadSPIx读SPI接口缓冲区。    ⑤WriteSPIx向SPI接口发送缓冲区写数据。    ⑥OpenSPIx打开SPI接口。该函数包含2个参数:configl和config2。configl中包含对SPI接口操作模式的配置信息,将写入控制寄存器;config2中包含SPI的状态信息,将写入状态寄存器。该函数在打开SPI接口的同时完成对其的配置。    ⑦puasSPIx函数将一个字符串数据写入到发送缓冲区中。    ⑧getsSPIx函数将从接收缓冲区读人指定长度的字符串数据,并转存到指定的空间。    除了这8个函数以外,该库还提供了相应的宏指令完成同样的功能,可以在程序中方便地使用。5 lSD4002    ISD4002工作于SPI串行接口。SPI协议是一个同步串行数据传输协议,协议假定微控制器的SPI移位寄存器在SCLK的下降沿动作。对ISD4002而言,在时钟上升沿锁存MOSI引脚数据.存下降沿将数据送至MISO引脚.协议具体内容如下:    ①所有串行数据传输开始于SS下降沿;    ②SS在传输期间必须保持为低电平,在两条指令之间保持为高电平;    ③数据在时钟上升沿移入,在下降沿移出;    ④SS变低,输入指令和地址之后,ISD才会开始录放动作;    ⑤指令格式是10位地址码加6位控制码;    ⑥ISD的任何操作(含快进)如果遇到EOM或OVF则产生一个中断,该中断状态在下一个SPI周期开始时被清除;    ⑦使用读指令会使中断状态为移出ISD的MISO引脚时,控制及地址数据也同步从MOSI移入;    ⑧所有操作在运行位(RUN)置1时开始,置0时结束;    ⑨所有指令都在SS上升沿开始执行。    其时序如图2所示。    对于ISD4002,器件延时TPUD(8kHz采样时,约为25 ms)后才能开始操作;因此,用户发完上电指令后,必须等待TPUD.才能发出一条操作指令。下面是典型的操作。    从00处发音,应遵循如下时序:    发POWERUP命令;    等待TPUD(上电延时);    发地址值为00的SFTPLAY命令;    发PLAY命令。    器件会从00地址开始放音,当出现EOM时,立即中断,停止放音。    如果从00处录音,则按以下时序;    发POWER UP命令;    等待TPUD(上电延时);    发POWER UP命令    等待2倍TPUD;    发地址值为00的SETREC命令;    发REC命令。    器件便从00地址开始录音,一直到出现OVF(存储器末尾)时,录音停止。其工作时序如图3所示。6 电路设计    本电路采用dsPICC30F6014数字信号控制器,通过3个按键开关控制ISD4002录放音芯片的动作。S1、S2、S3分别接到控制器外部中断INTl、INT2、INT3上。当按下S1时,开始录音,再次按下S1时停止录音。如此反复即可实现多段录音。同理,按下S2时开始放音,再次按下S2是停止放音。如此反复顺序播放多段录音。按下S3关机。(1)硬件电路设计    电路原理如图4所示。整个电路由语音录放电路、话筒输入电路、按键开关电路及LCD显示电路构成。由于本设计输出直接驱动普通耳机,经实验不需外部功放电路,直接利用ISD4002内部功放输出即可。ISD4002作为从机,其SPI接口的MOSI接控制器的SDO;MISO接控制器的SDI;SCLK接SCK;SS接控制器的SS即可。LCD用于人机交互的界面显示。(2)软件设计    程序包括主程序以及几个子程序。主程序中,在完成初始化的工作之后,进入一个while循环,等待响应按键触发的中断,若有按键按下,则进入相应的中断服务程序。在按键S1的中断服务程序中,设置一个标志变量,Sl每按下一次,标志变量取反,用来控制录音及停止录音。同理,S2的中断服务程序中也设置一个标志变量,控制开始放音及停止放音。S3的中断服务程序中则发送Power-Down指令关机。程序清单中给出了主程序以及中断服务程序,另外包括LCD驱动程序以及dsPIC的SPI函数库等。(编者注:源程序见本刊网站www.dpi.com.cn。)7 总 结    该电路易于实现,功能简单实用,可扩展性较好;输出声音清晰、自然。如要增加录音时间,可选用ISD4000系列的其他芯片,程序基本相同。另外,在设计过程中有以下几点事项需要注意:    ①在SPI的数据传输中,不同芯片所定义的传输顺序可能不同,因此要注意是先传高位还是先传低位。ISD4002要求先传高位数据,如果与主芯片所定义的顺序相反,则只要把指令码反过来传即可。    ②由于ISD4002要求在时钟前半个周期把数据放在传输线上,因此,在使用dsPIC的SPI函数库时需要注意SPI初始化。在本设计中,使用的配置为SPl—CKE—ON&CLK_P0L_ACTIVE_HIGH。    以上两点可能会帮助解决一些常见问题。

    时间:2010-03-15 关键词: spi 语音芯片 isd dsplc

  • 语音芯片AP89010在POS系统中的应用

    引言 POS是Point Of Sales的英文缩写,即销售点终端。它利用磁卡或IC卡作为支付手段,使用方便、快捷和安全,且附加了很多的统计功能。POS系统的应用,减少了现金的流通量,方便了银行及商户之间的结算、统计等,使持卡人的消费变成一种快乐的体验,提升了银行的服务质量与效率,提高了用户的信誉度。 传统金融POS,一般在酒店、商场、连锁超市等场合使用,不带语音功能。每次刷卡交易靠售货员人工提示客户,完成确认金额、输入密码等操作。 台湾Aplus公司生产的一次性编程语音芯片AP89010,控制简单、成本低。该方案很适合POS系统使用,可设计在POS主机或配套销售的密码键盘主机电路中。在成本增加不多的前提下,增加语音功能可以大大提高产品的定位和形象,增强其竞争力。 1 AP89010工作原理 语音芯片AP89010具有DIPl6和SOPl6两种封装。出于体积较小考虑,POS系统选用SOPl6封装,引脚定义如图1所示。 AP89010工作电压为2.6~3.3 V,静态耗电<5μA,工作温度范围为一40~85℃。内部包含语音处理器、EPROM存储器、A/D转换器、D/A转换器、逻辑接口控制器、音频放大器、时钟振荡器等电路,完成从语音数据写入固化到语音高保真重放的全过程。外围电路一般只需要几个元件。AP89010支持PCM或ADPCM语音格式。可根据需要分为1~12组录放其语音,语音可录入时间最大为10 s(使用6 kHz 4位ADPCM译码器)。其语音录入需要在专门的计算机编程器上进行,一旦录入即成为固定数据,不能再更改或抹掉,永久保存。 器件各引脚功能如表1所列。 2 应用设计举例 作为POS系统中的一个子模块,语音芯片AP89010与主控MCU的逻辑框图如图3所示。 笔者设计的应用电路如图4所示。 2.1 AP89010的2种控制模式 AP89010芯片支持2种控制模式:按键触发模式和CPU并行触发模式。本例中采用CPU并行触发模式。AUDIO_S1、AUDIO_S2、AUDIO_S3、AUDIO_S4和AUDIO_SBT同主控MCU的GPIO口连接。 SBT作为触发信号,高电平选通播放。再通过分段控制S1~S4可选择触发12个不同的语音组,如表2所列。 软件可参考图5所示的时序进行控制。 AP89010最多允许录入124个语音片段,并最多允许组合成12个语音组。对于POS系统,可考虑表3和表4所列的语句组合。 语音源文件的采样率较高,音质效果相对好些,但会造成文件容量的增加。设计者需兼顾AP89010容量,控制在256 Kb以内。如果无法容纳,可以考虑选用Aplus公司同系列的AP89021芯片,内部EPROM容量为512 Kb。 语音源文件的录入,在调试阶段需用专门的编程器,配合PC端程序进行;量产阶段则可向供应商定制,在厂内一次性烧片,固化语音信息后再出货。 ROSC振荡电阻的取值,根据语音文件的采样频率而定,可从表5中查出。 本例中,采样频率为8 kHz,因此ROSC电阻(即R1)取200 kΩ。 2.2 AP89010的2种输出方式 AP89010芯片有2种输出方式:一种利用芯片VOUTl、VOUT2引脚直接驱动喇叭,但驱动能力较弱,只能选用小功率的喇叭;另一种利用芯片 COUT引脚电流放大输出,再外接三极管放大推动喇叭。本例中采用后者,驱动8 Ω、1W规格的喇叭。 COUT输出3 mA电流,BCP68T1三极管放大倍数hFE接近100,如图6所示。实际喇叭工作电流为三极管放大后的集电极电流Ic,根据ic=Ib·hFE,约为 300 mA。喇叭功率P=I2c·R,其中R为喇叭电阻8 Ω,可算出实际能驱动的喇叭功率为O.72W。电阻R2推荐为390Ω,根据实际情况调整为360Ω。 2.3 3种选择方式 OUTl、OUT2、OUT3可内部编程,作为IC工作状态的反馈信号,有表6所列的3种选择方式。 可用于LED灯,如闪烁则说明当前处于播放状态,不闪烁则说明播放完毕。也可连接MCU的GPIO口线,通过BUSY和STOP状态的读取,判断 AP89010是否处于播放状态,以便操作系统调度其他任务。本例中,仅采用OUTl驱动LED灯功能。当D1闪烁时,说明正在播放。 结语 笔者已在POS系统上调试验证了AP89010电路,并小批量生产,全部检验通过。总体来说,AP89010操作简便、音质逼真,该应用电路性能稳定、可靠性好。

    时间:2011-01-12 关键词: ap pos 语音芯片 89010

  • 基于SPI实现dsPlC与ISD语音芯片的通信设计

     介绍dsPIc数字信号控制器以厦ISD4002语音芯片的功能特点;特别介绍dsPIC的SPl库函数的功能及使用,并给出一种简单的语音录放电路。具有低成本、易使用等特点,有较高的实用价值。 1 dsPlC系列的简单介绍     dsPIC系列是Microchip公司推出的新型16位高性能数字信号控制器。它结合了单片机的控制优点及数字信号处理器(DSP)的高速运算特性,为嵌入式系统提供了单一芯片解决方案。它继承了PlC单片机系列的哈佛总线结构和精简指令集(RISC)技术,以及寻址方式简单、运行速度快、功耗低、驱动能力强等优点,同时集成了主板级的DSP功能,能够提供强大的数字信号处理能力;此外,还提供了如UART、CAN、SPI等丰富的外围接口,可以方便地与其他设备进行通信互联。本文介绍使用dsPIC数字信号控制器的SPI接口与ISD语音芯片进行通信控制,使用的芯片型号为dsPIc30F6014。 2 ISD系列语音录放芯片     ISD系列语音芯片是美国ISD公司推出的产品。该系列芯片采用多电平直接模拟存储(Chip Corder)专利技术,声音不需要A/D转换和压缩,每个采样直接存储在片内的闪烁存储器中,避免了A/D转换的误差;能够真实、自然地还原语音、音乐及效果声;避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。ISD4000系列采用CM0s技术,内含晶体振荡器、防混叠滤波器、平滑滤波器、自动静噪、音频功率放大器及高密度多电平闪烁存储阵列等,只需要很少的外围器件即可构成一个完整的语音录放系统。它的操作命令通过串行通信接口(SPI)或Microwire送入;采样频率可为4.O Hz、5.3 Hz、6.4 Hz、8.O Hz,频率越低,录放时间越长,但音质会有所下降;片内信息存于闪烁存储器中,可在断电情况下保存100年(典型值),反复录音10万次;器件工作电压3 v,工作电流25~30 mA,音质好,适用于移动电话及其他便携式电子产品。本设计使用的芯片型号为ISD4002,单片录放时间为120 s。 3 SPI接口介绍     SPI是由美国摩托罗拉公司推出的一种同步串行传输规范,常作为单片机外设芯片串行扩展接口。SPI有4个引脚:SS(从器件选择线)、SDO(串行数据输出线)、SDI(串行数据输入线)和SCK(同步串行时钟线)。SPI可以用全双工通信方式同时发送和接收8(16)位数据,过程如下:主机启动发送过程,送出时钟脉冲信号,主移位寄存器的数据通过SDO移入到从移位寄存器,同时从移位寄存器中的数据通过SDI移人到主移位寄存器中。8(16)个时钟脉冲过后,时钟停顿,主移位寄存器中的8(16)位数据全部移人到从移位寄存器中,随即又被自动装入从接收缓冲器中,从机接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。同理,从移位寄存器中的8位数据全部移入到主寄存器中,随即又被自动装入到主接收缓冲器中.主接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。主CPU检测到主接收缓冲器的满标志位或者中断标志位置1后,就可以读取接收缓冲器中的数据。同样,从CPU检测到从接收缓冲器满标志位或中断标志位置1后,就可以读取接收缓冲器中的数据,这样就完成了一次相互通信过程。这里设置dsPIC30F6014为主控制器,ISD4002为从器件,通过SPI口完成通信控制的过程。 4 dsPIC的SPI函数库     dsPIC30F6014提供了2个SPI接口模块,每个接口模块包括三个特殊功能寄存器和四个引脚。SPIxBUF是数据缓冲寄存器。需要注意的是,接收缓冲SPIxRBF和发送缓冲SPIxTBF共享同一个地址,即它们都是地址映射到SPIxBUF的。也就是说,当对接收或发送缓冲寄存器操作时,都只能对SPIxBUF进行操作,而不能直接对SPIxRBF或SPIxTBF进行操作。SPIxCON是控制寄存器,用来对sPI模块的操作模式等进行配置;SPIxSTAT是状态寄存器,用来标示SPI模块所处的状态。其模块框图如图1所示。     通过对控制寄存器的配置,可以将SPI模块设置为8位或16位模式、主模式或从模式、帧同步等多种操作模式,还可以对时钟边沿、时钟分频倍数等进行配置。这里使用了以dsPIC为主,ISD为从的主从模式。Microchip提供的外围接口库可以方便地完成这些配置工作。     dsPIC Language Tools Libraries是MictoChip公司提供给开发者的一套工具库,其中主要含3个子库.DSP库,提供常用的DSP函数;外围接口库,提供对dsPIC系列所有外围接口的驱动函数,包括SPI接口;标准C及数学函数库,可在Microchip的官方网站下载(www.microchip. com)。我们使用其中的外围接口库中的SPI库函数即可。SPI库中主要包括以下几个函数:     ①configIntSPIx SPI中断配置函数。该函数可以对sPI接口的中断使能位以及中断优先级进行配置,返回值为空。     ②CloseSPlx关闭SPI接口。     ③DataRdySPlx SPl接口数据就绪。该函数用来判断SPI接收缓冲区中是否有数据等待读出。若返回值为1,表示缓冲区中数据已经就绪,等待读出;若返回值为0,则标示缓冲区为空。     ④ReadSPIx读SPI接口缓冲区。     ⑤WriteSPIx向SPI接口发送缓冲区写数据。     ⑥OpenSPIx打开SPI接口。该函数包含2个参数:configl和config2。configl中包含对SPI接口操作模式的配置信息,将写入控制寄存器;config2中包含SPI的状态信息,将写入状态寄存器。该函数在打开SPI接口的同时完成对其的配置。     ⑦puasSPIx函数将一个字符串数据写入到发送缓冲区中。     ⑧getsSPIx函数将从接收缓冲区读人指定长度的字符串数据,并转存到指定的空间。     除了这8个函数以外,该库还提供了相应的宏指令完成同样的功能,可以在程序中方便地使用。   5 lSD4002     ISD4002工作于SPI串行接口。SPI协议是一个同步串行数据传输协议,协议假定微控制器的SPI移位寄存器在SCLK的下降沿动作。对ISD4002而言,在时钟上升沿锁存MOSI引脚数据.存下降沿将数据送至MISO引脚.协议具体内容如下:     ①所有串行数据传输开始于SS下降沿;     ②SS在传输期间必须保持为低电平,在两条指令之间保持为高电平;     ③数据在时钟上升沿移入,在下降沿移出;     ④SS变低,输入指令和地址之后,ISD才会开始录放动作;     ⑤指令格式是10位地址码加6位控制码;     ⑥ISD的任何操作(含快进)如果遇到EOM或OVF则产生一个中断,该中断状态在下一个SPI周期开始时被清除;     ⑦使用读指令会使中断状态为移出ISD的MISO引脚时,控制及地址数据也同步从MOSI移入;     ⑧所有操作在运行位(RUN)置1时开始,置0时结束;     ⑨所有指令都在SS上升沿开始执行。     其时序如图2所示。 对于ISD4002,器件延时TPUD(8kHz采样时,约为25 ms)后才能开始操作;因此,用户发完上电指令后,必须等待TPUD.才能发出一条操作指令。下面是典型的操作。     从00处发音,应遵循如下时序:     发POWERUP命令;     等待TPUD(上电延时);     发地址值为00的SFTPLAY命令;     发PLAY命令。     器件会从00地址开始放音,当出现EOM时,立即中断,停止放音。     如果从00处录音,则按以下时序;     发POWER UP命令;     等待TPUD(上电延时);     发POWER UP命令     等待2倍TPUD;     发地址值为00的SETREC命令;     发REC命令。     器件便从00地址开始录音,一直到出现OVF(存储器末尾)时,录音停止。其工作时序如图3所示。 6 电路设计     本电路采用dsPICC30F6014数字信号控制器,通过3个按键开关控制ISD4002录放音芯片的动作。S1、S2、S3分别接到控制器外部中断INTl、INT2、INT3上。当按下S1时,开始录音,再次按下S1时停止录音。如此反复即可实现多段录音。同理,按下S2时开始放音,再次按下S2是停止放音。如此反复顺序播放多段录音。按下S3关机。 (1)硬件电路设计     电路原理如图4所示。整个电路由语音录放电路、话筒输入电路、按键开关电路及LCD显示电路构成。由于本设计输出直接驱动普通耳机,经实验不需外部功放电路,直接利用ISD4002内部功放输出即可。ISD4002作为从机,其SPI接口的MOSI接控制器的SDO;MISO接控制器的SDI;SCLK接SCK;SS接控制器的SS即可。LCD用于人机交互的界面显示。 (2)软件设计     程序包括主程序以及几个子程序。主程序中,在完成初始化的工作之后,进入一个while循环,等待响应按键触发的中断,若有按键按下,则进入相应的中断服务程序。在按键S1的中断服务程序中,设置一个标志变量,Sl每按下一次,标志变量取反,用来控制录音及停止录音。同理,S2的中断服务程序中也设置一个标志变量,控制开始放音及停止放音。S3的中断服务程序中则发送Power-Down指令关机。程序清单中给出了主程序以及中断服务程序,另外包括LCD驱动程序以及dsPIC的SPI函数库等。(编者注:源程序见本刊网站www.dpi.com.cn。) 7 总 结     该电路易于实现,功能简单实用,可扩展性较好;输出声音清晰、自然。如要增加录音时间,可选用ISD4000系列的其他芯片,程序基本相同。另外,在设计过程中有以下几点事项需要注意:     ①在SPI的数据传输中,不同芯片所定义的传输顺序可能不同,因此要注意是先传高位还是先传低位。ISD4002要求先传高位数据,如果与主芯片所定义的顺序相反,则只要把指令码反过来传即可。     ②由于ISD4002要求在时钟前半个周期把数据放在传输线上,因此,在使用dsPIC的SPI函数库时需要注意SPI初始化。在本设计中,使用的配置为SPl—CKE—ON&CLK_P0L_ACTIVE_HIGH。     以上两点可能会帮助解决一些常见问题。

    时间:2011-12-14 关键词: spi 语音芯片 isd dsplc

  • 语音芯片AP89010工作原理及其在POS系统中的应用

    引言 POS是Point Of Sales的英文缩写,即销售点终端。它利用磁卡或IC卡作为支付手段,使用方便、快捷和安全,且附加了很多的统计功能。POS系统的应用,减少了现金的流通量,方便了银行及商户之间的结算、统计等,使持卡人的消费变成一种快乐的体验,提升了银行的服务质量与效率,提高了用户的信誉度。 传统金融POS,一般在酒店、商场、连锁超市等场合使用,不带语音功能。每次刷卡交易靠售货员人工提示客户,完成确认金额、输入密码等操作。 台湾Aplus公司生产的一次性编程语音芯片AP89010,控制简单、成本低。该方案很适合POS系统使用,可设计在POS主机或配套销售的密码键盘主机电路中。在成本增加不多的前提下,增加语音功能可以大大提高产品的定位和形象,增强其竞争力。 1 AP89010工作原理 语音芯片AP89010具有DIPl6和SOPl6两种封装。出于体积较小考虑,POS系统选用SOPl6封装,引脚定义如图1所示。 AP89010工作电压为2.6~3.3 V,静态耗电<5μA,工作温度范围为一40~85℃。内部包含语音处理器、EPROM存储器、A/D转换器、D/A转换器、逻辑接口控制器、音频放大器、时钟振荡器等电路,完成从语音数据写入固化到语音高保真重放的全过程。外围电路一般只需要几个元件。AP89010支持PCM或ADPCM语音格式。可根据需要分为1~12组录放其语音,语音可录入时间最大为10 s(使用6 kHz 4位ADPCM译码器)。其语音录入需要在专门的计算机编程器上进行,一旦录入即成为固定数据,不能再更改或抹掉,永久保存。 器件各引脚功能如表1所列。 2 应用设计举例 作为POS系统中的一个子模块,语音芯片AP89010与主控MCU的逻辑框图如图3所示。 笔者设计的应用电路如图4所示。 2.1 AP89010的2种控制模式 AP89010芯片支持2种控制模式:按键触发模式和CPU并行触发模式。本例中采用CPU并行触发模式。AUDIO_S1、AUDIO_S2、AUDIO_S3、AUDIO_S4和AUDIO_SBT同主控MCU的GPIO口连接。 SBT作为触发信号,高电平选通播放。再通过分段控制S1~S4可选择触发12个不同的语音组,如表2所列。 软件可参考图5所示的时序进行控制。 AP89010最多允许录入124个语音片段,并最多允许组合成12个语音组。对于POS系统,可考虑表3和表4所列的语句组合。 语音源文件的采样率较高,音质效果相对好些,但会造成文件容量的增加。设计者需兼顾AP89010容量,控制在256 Kb以内。如果无法容纳,可以考虑选用Aplus公司同系列的AP89021芯片,内部EPROM容量为512 Kb。 语音源文件的录入,在调试阶段需用专门的编程器,配合PC端程序进行;量产阶段则可向供应商定制,在厂内一次性烧片,固化语音信息后再出货。 ROSC振荡电阻的取值,根据语音文件的采样频率而定,可从表5中查出。 本例中,采样频率为8 kHz,因此ROSC电阻(即R1)取200 kΩ。 2.2 AP89010的2种输出方式 AP89010芯片有2种输出方式:一种利用芯片VOUTl、VOUT2引脚直接驱动喇叭,但驱动能力较弱,只能选用小功率的喇叭;另一种利用芯片 COUT引脚电流放大输出,再外接三极管放大推动喇叭。本例中采用后者,驱动8 Ω、1W规格的喇叭。 COUT输出3 mA电流,BCP68T1三极管放大倍数hFE接近100,如图6所示。实际喇叭工作电流为三极管放大后的集电极电流Ic,根据ic=Ib·hFE,约为 300 mA。喇叭功率P=I2c·R,其中R为喇叭电阻8 Ω,可算出实际能驱动的喇叭功率为O.72W。电阻R2推荐为390Ω,根据实际情况调整为360Ω。 2.3 3种选择方式 OUTl、OUT2、OUT3可内部编程,作为IC工作状态的反馈信号,有表6所列的3种选择方式。 可用于LED灯,如闪烁则说明当前处于播放状态,不闪烁则说明播放完毕。也可连接MCU的GPIO口线,通过BUSY和STOP状态的读取,判断 AP89010是否处于播放状态,以便操作系统调度其他任务。本例中,仅采用OUTl驱动LED灯功能。当D1闪烁时,说明正在播放。 结语 笔者已在POS系统上调试验证了AP89010电路,并小批量生产,全部检验通过。总体来说,AP89010操作简便、音质逼真,该应用电路性能稳定、可靠性好。

    时间:2012-04-15 关键词: ap pos 语音芯片 89010

  • AT89C2051控制语音芯片录放音系统电路图

    AT89C2051控制语音芯片录放音系统电路图

    语音芯片应用电路 ISD2560 是ISD 系列单片语音录放集成电路的一种,是一种永久记忆型录放语音电路,录音时间为60 秒,能重复录放达10 万次。它采用直接电平存储技术,省去了A/D、D/A 转换器。ISD2560 集成度高,内部包括前置放大器、内部时钟、定时器、采样时钟、滤波器、自动增益控制、逻辑控制、模拟收发器、解码器、和480KB 的EERPOM 等。内部EERPOM存储单元,均匀分为600 行,具有600 个地址单元,每个地址单元指向其中一行,每一个地址单元的地址分辨率为100MS。ISD2560 控制电平与TTL 电平兼容,接口简单,使用方便。   ISD2560 内置了若干操作模式,可用最少的外围器件实现最多的功能。操作模式也有地址端控制;当最高位都为1 时,其他地址端最高就选择某个模式。因此操作模式和直接寻址相互排斥。操作模式可由微控制器也可有硬件实现。基本电路原理图如下:录音按下录音键接地,是PD 端、P/R 端为低电平,此时启动录音;结束时松开按键,单片机有让P/R 端回到高电平,既完成一段语音的录制。同样的方法可录取第二段、第三段等。值得注意的是,录音时间不能超过预先设定的每段语音的时间。放音的操作更为简单,按下录音键接高电平,使P/D 端P/R 端为低电平启动方音功能;结束时,松开按键,即完成一段语音的播放。 采样单片机控制语音芯片 录音时,按下录音键,单片机通过D 端口线设置语音段的起始地址,再使PD 端、P/R 端为低电平启动录音;结束时,松开按键,单片机有让P/R 端回到高电平,即完成一段语音的录制。同样的方法可以录取第二段、第三段等。值得注意的是,录音时间不能超过预先设定的每段语音的时间。 放音时,根据需播放的语音内容,找到相应的语音段起始地址,并通过口线送出。P/R 端设为低电平,并让/CE 端产生一负脉冲启动放音,这时单片机只需要等待ISD2560信息结束信号。信号为一负脉冲,在负脉冲的上升沿,该段语音才播放结束,所以单片机必须要检测到的上升沿才能播放第二段,否则播放的语音就不连续。ISD2560 与单片AT89C2051($0.5999) 的接口电路以及外围电路如图所示。单片机的P1 口、P3.4 和P3.5 分别与ISD2560 的地址线相连,用以设置语音段的起始地址。P3.0~P3.3 用以控制录放音状态。P3.7 连接一按键,供录音时使用。由TL7705($0.1875) 构成可靠复位及电源监视电路。   ISD2560 虽然提供了地址输入线,但它的内部信息段的地址却无法读出。本系统采用单片机来控制,不需读出信息地址,而直接设置信息段起始地址。其实现方式有两种:一是由于ISD2560的地址分辨率为100 ms,所以可用单片机内部定时器定时100 ms,然后再利用一计数器对单片机定时次数进行计数,则计数器的计数值为语音段所占用的地址单元。该方式能充分利用ISD2560内部的E2PROM,在字段较多时可利用该方法。二是语音字段如果较少,则可根据每一字段的内容多少,直接分配地址单元。一般按每1 s 说3 个字计算,60 s 可说180 个字,再根据ISD2560 的地址分辨率为100 ms,即可计算出语音段所需的地址单元数。本电路采用第二种方式。

    时间:2017-06-16 关键词: at89c2051 语音芯片 音响电路 录放音系统

  • 语音芯片UM5100的分段使用电路

    语音芯片UM5100的分段使用电路

    时间:2009-07-27 关键词: 语音芯片 um 分段 5100 电话电路

  • 这家AI芯片公司厉害了,获微软/英特尔等6大科技公司的千万美元投资

    这家AI芯片公司厉害了,获微软/英特尔等6大科技公司的千万美元投资

    消息,位于美国加利福尼亚州的AI芯片初创企业Syntiant获得由M12(前身为微软风险投资公司)领投的2500万美元B轮融资,其它战略投资者包括亚马逊Alexa基金、应用创投(Applied Ventures)、英特尔资本、摩托罗拉解决方案风险投资、博世风投。Syntiant首席执行官Kurt Busch表示:“我们很高兴得到这些世界上最伟大的科技公司的支持。随着现有和新投资者的加入,我们也增加了董事会成员。未来我们能够将Syntiant的神经网络技术商业化,用于电池供电设备,真正实现普及的人工智能。”作为一家初创公司,Syntiant能获得多家知名科技厂商投资的一个重要的原因就是其产品的独特性。据了解,Syntiant打造的是一类全新的超低功耗、高性能深度神经网络处理器,目标是让任何设备(包括电池供电系统)都能轻松添加语音控制。更具体地说,Syntiant的神经决策处理器(Neural Decision Processor,NDP)没有传统处理器架构的限制,使用模拟神经网络,该网络可以通过极高的内存效率实现极低的功耗,并且具有大规模并行乘法累加计算的能力。Syntian声称与传统的数字存储架构相比,NPD的效率提高提高了约50倍。据悉, Syntiant的第一批产品已经成功流片,该公司在本月早些时候演示了一个原型NDP,它可以同时支持数十种应用程序定义的音频和关键字分类,使开发人员能够创建定制的始终在线的语音用户界面。同时,该处理器针对音频数据速率进行了优化,能够进行扬声器识别,音频事件检测、环境分类、传感器分析。Kurt Busch表示,Syntiant将使用新的融资实现初始产品商业化,并开始研发其第二代芯片,还将扩大Syntiant技术在视频方面的应用。该芯片是20 tera-operations/watt 的NPD,计划于明年上半年开始提供样品。Syntiant获得知名科技公司投资的另一个重要原因就是其AI处理器与投资方的业务能产生一定的联系。英特尔副总裁兼英特尔投资集团总经理Dave Flanagan表示:“边缘端机器学习是定制半导体的新前沿,领投A轮之后,我们对Syntiant取得的进步充满热情。” 博世风投总经理Luis Llovera说道:“Syntiant的技术和产品与博士的产品相关,特别是消费类传感器应用。”亚马逊Alexa基金主管Paul Bernard更是表示:“Syntiant完全符合我们推动语音技术创新的使命,他们的技术具有像Alexa一样巨大的潜力,特别是在需要长续航、低功耗、高精度语音识别的场景中,我们期待与Syntiant合作将语音技术扩展到新的设备和场景。”应用创投负责人Michael Stewart则表示:“Syntiant的神经网络技术以及其以内存为中心的架构非与应用材料(Applied Materials)在材料工程领域的专长非常吻合,因为我们能够在设备性能和新的材料驱动技术方面实现根本性的飞跃。” 摩托罗拉解决方案首席技术官Paul Steinberg说:“由于我们的许多用户的工作环境通常处于危险之中,Syntiant的深度学习能力非常适合资源受限的边缘设备,这些设备可以帮助我们的客户包括警察、石油钻井工人等安全高效地工作。”由此,认为,一家初创公司想要获得融资和巨头的认可,拥有技术的独特性很重要,当然这个独特的技术也需要有非常好的应用前景。如今,许多AI芯片公司都将目光瞄向AI视觉芯片,AI语音芯片似乎被一些人认为是技术含量没那么高的AI芯片,Syntiant似乎证明了只要产品足够好,还是能获得认可。同时,我们也可以看到全球人工智能芯片市场似乎没有降温的迹象。根据Allied Market Research最近发布的一份报告,全球人工智能芯片市场预计到2025年将从2017年的45.2亿美元达到911.9亿美元。推动AI发展的芯片巨头和初创公司都有机会。参考 techstartups、eetimes相关文章:全球最大矿机公司比特大陆开启上市之路,未来AI芯片领域的新标杆?增速惊人!AI芯片市场2025年市场规模将达378亿美元华为力推自研AI芯片,还记得大明湖畔的寒武纪吗?版权文章,未经授权禁止转载。

    时间:2018-11-06 关键词: ai芯片 深度神经网络 语音芯片 syntiant

  • 科大讯飞发布家电行业专用语音芯片CSK400X系列 算力128GOPS/s

    科大讯飞发布家电行业专用语音芯片CSK400X系列 算力128GOPS/s

    10月24日消息,2019年科大讯飞全球1024开发者节在合肥开幕。科大讯飞集团副总裁于继栋发布了联合生态合作伙伴打造的家电行业专用语音芯片CSK400X系列,算力达到128GOPS/s,通过深度神经网络算法解决家居中的噪音问题,支持200个唤醒词作为命令词。 于继栋称,AIOT已经成为讯飞的核心战略之一,2020年AIoT将在家电领域迎来爆发。目前,AIoT时代的操作系统iFLYOS2.0了涵盖智能家居、智能电视、车载、儿童硬件、智慧酒店、智能穿戴等多个领域的行业方案。 科大讯飞全球1024开发者节是以A.I.开发者为受众群体的人工智能大会,由科大讯飞公司发起并主办,自2017年至今已第三届。

    时间:2019-11-08 关键词: 芯片 科大讯飞 语音芯片

  • ISD2560语音芯片在排队机系统中的应用

    摘要:详细介绍了Winbond公司生产的ISD2560语音芯片的引脚功能、操作模式以及具体使用方法,给出了用AT89C51与ISD2560构成的语音系统的硬件结构和软件设计方法。     关键词:单片机;ISD2560;语音芯片;ISD1425 目前,电脑语音服务的应用范围越来越广,如电脑语音钟、语音型数字万用表、手机话费查询系统以及公共汽车报站器等。而Winbond公司生产的ISD2500系列语音芯片是具有较强功能的一种电脑语音录放器件,它能够应用在很多需要语音服务的场合。AT89C51是ATMEL公司生产的性能良好、价格便宜的单片机。文中介绍了用AT89C51和ISD2560构成的智能型排队机的语音部分,可实现语音的分段录取和组合回放,同时可通过修改软件实现整段或循环播放。本文重点介绍了用该电路来完成语音的组合播放等功能的实现方法。 ISD2560是ISD系列单片语音录放集成电路的一种。这是一种永久记忆型语音录放电路,录音时间为60s,可重复录放10万次。该芯片采用多电平直接模拟量存储专利技术,每个采样值可直接存储在片内单个EEPROM单元中,因此能够非常真实、自然地再现语音、音乐、音调和效果声,从而避免了一般固体录音电路因量化和压缩造成的量化噪声和“金属声”。该器件的采样频率为8.0kHz,同一系列的产品采样频率越低?录放时间越长? 但通频带和音质会有所降低。此外,ISD2560还省去了A/D和D/A转换器。其集成度较高,内部包括前置放大器、内部时钟、定时器、采样时钟、滤波器、自动增益控制、逻辑控制、模拟收发器、解码器和480 k字节的EEPROM。ISD2560内部EEPROM存储单元均匀分为600行,有600个地址单元,每个地址单元指向其中一行,每一个地址单元的地址分辨率为100 ms。此外,ISD2560还具备微控制器所需的控制接口。通过操纵地址和控制线可完成不同的任务,以实现复杂的信息处理功能,如信息的组合、连接、设定固定的信息段和信息管理等。ISD2560可不分段,也可按最小段长为单位来任意组合分段。1 ISD2560的引脚功能 ISD2560具有28脚SOIC和28脚PDIP两种封装形式。图1所示是其引脚排列。各引脚的主要功能如下: 电源(VCCA,VCCD):为了最大限度的减小噪声,芯片内部的模拟和数字电路使用不同的电源总线,并且分别引到外封装上。模拟和数字电源端最好分别走线,并应尽可能在靠近供电端处相连,而去耦电容则应尽量靠近芯片。 地线(VSSA,VSSD):由于芯片内部使用不同的模拟和数字地线,因此,这两脚最好通过低阻抗通路连接到地。 节电控制(PD):该端拉高可使芯片停止工作而进入节电状态。当芯片发生溢出?即OVF端输出低电平?后,应将本端短暂变高以复位芯片;另外,PD端在模式6下还有特殊的用途。 片选(CE) :该端变低且PD也为低电平时,允许进行录、放操作。芯片在该端的下降沿将锁存地址线和P/ R端的状态;另外,它在模式6中也有特殊的意义。 录放模式(P/ R):该端状态一般在CE的下降沿锁存。高电平选择放音,低电平选择录音。录音时,由地址端提供起始地址,直到录音持续到CE或PD变高,或内存溢出;如果是前一种情况,芯片将自动在录音结束处写入EOM标志。放音时,由地址端提供起始地址,放音持续到EOM标志。如果CE一直为低,或芯片工作在某些操作模式,放音则会忽略EOM而继续进行下去,直到发生溢出为止。 信息结尾标志(EOM):EOM标志在录音时由芯片自动插入到该信息段的结尾。当放音遇到EOM时,该端输出低电平脉冲。另外,ISD2560芯片内部会自动检测电源电压以维护信息的完整性,当电压低于3.5V时,该端变低,此时芯片只能放音。在模式状态下,可用来驱动LED,以指示芯片当前的工作状态。图2    溢出标志(OVF):芯片处于存储空间末尾时,该端输出低电平脉冲以表示溢出,之后该端状态跟随CE端的状态,直到PD端变高。此外,该端还可用于级联多个语音芯片来延长放音时间。 话筒输入(MIC):该端连至片内前置放大器。片内自动增益控制电路(AGC)可将增益控制在-15~24dB。外接话筒应通过串联电容耦合到该端。耦合电容值和该端的10kΩ输入阻抗决定了芯片频带的低频截止点。 话筒参考(MIC REF):该端是前置放大器的反向输入。当以差分形式连接话筒时,可减小噪声,并提高共模抑制比。 自动增益控制(AGC):AGC可动态调整前置增益以补偿话筒输入电平的宽幅变化,这样在录制变化很大的音量(从耳语到喧嚣声)时就能保持最小失真。响应时间取决于该端内置的5kΩ电阻和从该端到VSSA端所接电容的时间常数。释放时间则取决于该端外接的并联对地电容和电阻设定的时间常数。选用标称值分别为470kΩ和4.7μF的电阻、电容可以得到满意的效果。 模拟输出(ANA OUT):前置放大器输出。其前置电压增益取决于AGC端电平。 模拟输入(ANA IN):该端为芯片录音信号输入。对话筒输入来说,ANA OUT端应通过外接电容连至该端,该电容和本端的3kΩ输入阻抗决定了芯片频带的附加低端截止频率。其它音源可通过交流耦合直接连至该端。 扬声器输出(SP+、SP-):可驱动16Ω以上的喇叭(内存放音时功率为12.2mW?AUX IN放音时功率为50mW)。单端输出时必须在输出端和喇叭间接耦合电容?而双端输出则不用电容就能将功率提高至4倍。图3    辅助输入(AUX IN):当CE和P/ R为高,不进行放音或处入放音溢出状态时?该端的输入信号将通过内部功放驱动喇叭输出端。当多个ISD2560芯片级联时?后级的喇叭输出将通过该端连接到本级的输出放大器。为防止噪声?建议在存放内存信息时?该端不要有驱动信号。 外部时钟(XCLK):该端内部有下拉元件,不用时应接地。 地址/模式输入(AX/MX) :地址端的作用取决于最高两位(MSB,即A8和A9)的状态。当最高两位中有一个为0时,所有输入均作为当前录音或放音的起始地址。地址端只作输入,不输出操作过程中的内部地址信息。地址在CE的下降沿锁存。当最高两位全为1时,A0~A6可用于模式选择。 2 操作模式 由于ISD2560内置了若干种操作模式,因而可用最少的外围器件实现最多的功能。操作模式也由地址端控制;当最高两位都为1时,其它地址端置高可选择某个(或某几个)特定模式。因此操作模式和直接寻址相互排斥。具体操作模式见表1所列。操作模式可由微控制器也可由硬件实现。使用操作模式要注意两点:(1)所有操作最初都是从0地址?即存储空间的起始端?开始。后续的操作根据选用的模式可从其它地址开始。但是,电路由录转放或由放转录(M6模式除外),或都执行了掉电周期后,地址计数器将复位为0。(2)当CE变低且最高两地址位同为高时,执行操作模式。这种操作模式将一直有效,直到CE再次由高变低,芯片重新锁存当前的地址/模式端电平并执行相应的操作为止。表1 操作模式简表 模  式 功  能 典  型  应  用 可组合使用的模式 M0 信息检索 快进入信息 M4、M5、M6 M1 删除WOM 在最后一条信息结束处放EOM M3、M4、M5、M6 M2 未用 保留 N/A M3 循环 从0地址连续放音 M1、M5、M6 M4 连续寻址 录放连续的多段信息 M0、M1、M5 M5 CE电平有效 允许暂停 M0、M1、M3、M4 M6 按键模式 简化外围电路 M0、M1、M3 3 基于ISD2560的语音播放电路设计 3.1 系统硬件电路 图2所示为ISD2560与AT89C51连接示意图。图中,单片机系统的晶振Y1为11.0593MHz,EOM直接接到P1.7,PD接到P1.6,CE接到P3.6,XCLK接地。SN74HC573是地址锁存器,LM386N-1为音频功率放大器。本系统中的语音芯片工作在放音状态下,其片内的信息可通过专用的ISD1425高级语音编程拷贝机拷贝,因此放音质量非常好,也可以通过它来读取每段语音的存储地址。图3所示是ISD2560的放音时序图。 3.2 系统软件设计 基于ISD2560的语音系统软件设计流程图如图4所示。假设要播放的语音段有20段,那么,把一个数送到DPTR对应的地址中去时,必须先等待语音芯片的EOM脚电平变低,然后再等待EOM脚电平变高,才可以继续读其它段的内容;否则会出现“啪啪”声。另外,也可以在各段语音的后面加一些适当的延时。4 结束语 ISD2560语音芯片在语音录放系统中的实际应用效果非常好,而且编程也比较简单,与其它一些数字语音芯片相比,ISD2560的突出特点是放音效果极佳,能够非常真实、自然地再现语音、音乐、音调和效果声,另外,使用该芯片也可自己设计电路实现录音操作,使用十分方便。

    时间:2004-12-11 关键词: 系统 2560 语音芯片 isd

  • ISD4004-16M语音芯片的循环录放电路设计

        摘要:针对ISD语音芯片的特点,设计一种由单片机控制,能够循环录放的语音电路,可作为录音机,复读机、音频记录仪使用,既节省存储空间,又降低成本,具有较高的实用价值。     关键词:ISD4004 语音 循环录放 目前,市场上的固体录音机及各种录音笔,大多采用的是顺序录音,不具备循环录音功能,一旦存储器录满,必须重新操作才行。本文设计一种能够循环录放的语音电路,即可解决上述问题。 1 器件功能介绍 ISD系列语音芯片是美国ISD公司推出的产品。该系列语音芯片采用多电平直接接模拟存储(Chip Corder)专利技术,声音不需要A/D转换和压缩,每个采样值直接存储在片内的闪烁存储器中,没有A/D转换误差,因此能够真实、自然地再现语音、音乐及效果声。避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。图1    ISD4004语音芯片采用CMOS技术,内含晶体振荡器、防混叠滤波器、平滑滤波器、自动静噪、音频功率放大器及高密度多电平闪烁存储阵列等(见图1),因此只需很少的外围器件就可构成一个完整的声音录放系统。芯片设计是基于所有操作由微控制器控制,操作命令通过串行通信接口(SPI或Microwire)送入。采样频率可为4.0Hz、5.3Hz、6.4Hz、8.0kHz,频率越低,录放时间越长,而音质则有所下降。片内信息存于内烁存储器中,可在断电情况下保存100年(典型值)反复录音10万次。器件工作电压3V,工作电流25~30mA,维持电流1μA?单片录放语音时间8~16min,音质好,适用于移动电话机及其它便携式电子产品中。 1.1 引脚描述 ISD4004系列芯片引脚图如图2所示。图2    同相模拟输入(ANA IN+)-这是录音信号的同相输入端,输入放大器可用单端或差分驱动。单端输入时,信号由耦合电容输入,最大幅度为峰峰值32mV,耦合电容和本端的3kΩ输入阻抗决定了芯片频率的低端截止频率。在差分驱动时,信号最大幅度为峰峰值16mV。 反相模拟输入(ANA IN-)-差分驱动时,这是录音信号的反相输入端。信号通过耦合电容输入,最大幅度为峰峰值16mV,本端的标称输入阻抗为56kΩ,单端驱动时,本端通过电容接地。两种方式下,ANA IN+和ANA IN-端的耦合电容值应用相同。 音频输出(AUD OUT)-提供音频输出,可驱动5kΩ的负载。 片选(SS)-此端为低,即选中ISD4004系列。 串行输入(MOSI)-此为单行输入端,主控制器应在串行时钟上升沿之前半个周期将数据放到本端,供ISD输入。图3    串行输出(MISO)ISD-串行输出端,ISD未选中时,本端呈高阻态。 串行时钟(SCLK)-ISD的时钟输入端,由于控制器产生,用于同步MOSI和MISO的数据传输。数据在SCLK上升沿锁存到ISD,在下降沿移出ISD。 中断(INT)-本端为漏极开路输出,ISD在任何操作(包括快进)中检测到EOM或OVF时,本端变低并保持,中断状态在下一个SPI周期开始清除,中断状态也可用RITN指令读取。 行地址时钟(RAC)-漏极开始输出。生个RAC周期表示ISD存储器的操作进行了一行(ISD4004系列中的存储器有2400行)。8kHz采样频率的器件,RAC周期为200ms,其中175ms保持高电平,低电平为25ms。快进模式下,RAC为218.75μs高电平,31.25μs为低电平,该端可用于存储管理技术。 外部时钟(XCLK)-本端有内部下拉元件,芯片内部的采样时钟在出厂前已调校,误差在+1%内,在不外接时钟时,此端必须接地。 自动静噪(AM CAP)-1μF电容构成内部峰值检测电路的一部分,检测出的峰值电平与内部设定的阈值作比较,决定自动静噪电路的工作与否。大信号时自动静噪电路不衰减,静音时衰减6dB。同时,1μF电容也影响自动静噪电路时信号幅度的响应速度,本端接VCCA则禁止自动静噪。    1.2 串行外部接口(SPI) ISD4004工作于SPI串行接口。SPI协议是一个同步串行数据传输协议,协议假定微控制器的SPI移位寄存器在SCLK的下降沿动作。因此,对ISD4004而言,在时钟上升沿锁存MOSI引脚数据,在下降沿将数据送至MISO引脚。协议具体内容如下。 ①所有串行数据传输开始于SS下降沿。 ②SS在传输期间必须保持为低电平,在两条指令之间保持为高电平。 ③数据在时钟上升沿移入,在下降沿移出。 ④SS变低,输入指令和地址后,ISD行才开始录放保持。 ⑤指令格式是8位控制码加16位地址码。图5    ⑥ISD的任何操作(含快进)如果遇到EOM或OVF,则产生一个中断,该中断状态在下一个SPI周期开始时被清除。 ⑦使用“读”指令会使中断状态位移出ISD的MISO引脚时,控制及地址数据也同步从MOSI端移入。 ⑧所有操作在运行位(RUN)置1时开始,置0时结束。    ⑨所有指令都在SS端上升沿开始执行。    OVF标志指示ISD录放操作已到达存储器的末尾。EOM标志只有放音过程中检测到内部的EOM标志时,此状态位置1,如图3所示。 以下列举了几种对ISD器件进行操作进的批令次序。图6    *信息快进。用户不必知道确切的地址,就能快地跳过一条信息。信息快进只用于放音模式。放音速度是正常的1600倍,遇到EOM后停止,内部地址计数器加1,并接下条信息开始处。 *上电顺序。器件延时TPUD(8kHz)采样时,约25ms后才能开始操作。因此,用户发完上电指令后,必须等待TPUD,才能发出一条操作指令。例如从00处放音,应遵循如下时序:发power up命令;等待TPUD(上电延时);发地址值为00的SETPLAY命令;发PLAY命令。器件会从00地址开始放音,当出现EOM时,立即中断,停止放音。如果从00处录音,则按以下时序:发power up命令;等待TPUD(上电延时);发power up命令;等待2倍TPUD;发地址值为00的SETREC命令;发REC命令。器件便从00地址开始录音,一直到出现OVF(存储器末尾),录音停止。 1.3 时序 8位及24位命令格式如图4和图5所示。 录音、放音、停止时序如图6所示。图72 循环录放电路的设计 该电路采用AT89C51单片机,通过操作5个微型按扭开关和一个微动开关实现功能转换,操作命令由串行通信接口(SPI)送入。电路即可工作在顺序模式,又可工作在循环模式。当工作在循环模式。当工作在循环模式的录音状态时,ISD芯片将始 终记录最后16min的语音信息,直至按下停止键。 2.1 硬件电路设计 电路原理图如图7所示,整个电路由单片机控制显示电路、ISD4004语音录放电路、话筒输入电路、音频功率放大电路几部分构成。ISD4004的片选信号SS由控制器P2.0提供。单片机AT89C51的串行口工作于同步移位寄存器方式,同步移位脉冲由TXD(P3.1)输出至ISD4004的串行时钟输入端SCLK,数据由RXD(P3.0)输入输出。因AT89C51单片机不具备(SPI)接口,故这里通过三态门将RXD(P3.0)数据线复用。对单片机而言,发射时作为输出,接至ISD4004的串行输入端(MOSI);接收时作为输入,接至ISD4004的串行输出端(MISO)。电路中拔动开关Ks用于选择启用或取消循环录音功能。 2.2 软件设计 整个程序包括主程序和中断子程序两部分。AT89C51单片机提供了用户键盘、显示和ISD4004所需接口。它接收击键功作,并将相应指令传给ISD4004,同时监控ISD4004的中断输出。当开关KS闭合(KS=1)时,读取ISD4004的状态寄存器,从而根据OVF和EOM的状态进行相应的处理。当OVF=1,即存储器溢出时,则不管当前为何种状态均将ISD4004的地址置零,并继续运行原指令;当EOM=1时,当前状态只可能为放音或快进,若为快进则置为放音态,并继续运行。如此设计便实现了循环录放的功能,同时在快进时,自动停止在下一个语音段开始处,并继续放音。 中断程序流程图如图8所示。源程序清单见网站www.dpj.com.cn。 3 总体性能与功能扩展 该电路正常工作时功耗为200mW,音量增大时功耗有所增加。整个电路工作稳定、可靠,输出的声音清晰,音色优美,主观上听不到循环模式下将ISD地址置零所产生的间断音。系统最大录放时间为16min,如需增加录放时间,只需增加ISD4004芯片数量,通过片选即可实现。例如,采用4片ISD4004,就能达到近一个小时的录音长度。

    时间:2005-04-17 关键词: 16 语音芯片 4004 isd

  • 用SPI实现dsPlC与ISD语音芯片的通信

    摘要  介绍dsPIc数字信号控制器以厦ISD4002语音芯片的功能特点;特别介绍dsPIC的SPl库函数的功能及使用,并给出一种简单的语音录放电路。具有低成本、易使用等特点,有较高的实用价值。关键词 dsPIC dsPlC30F6014 ISD4002 语音芯片     在很多应用场合中,需要用到语音录放功能,如复读机、电话自动应答装置等。本文介绍一种简单实用的dsPIc数字信号控制器,用来完成语音录放功能。由于dsPIC强大的数字信号处理功能,可以提供后续的复杂处理等,具有良好的易扩展性。 1 dsPlC系列的简单介绍    dsPIC系列是Microchip公司推出的新型16位高性能数字信号控制器。它结合了单片机的控制优点及数字信号处理器(DSP)的高速运算特性,为嵌入式系统提供了单一芯片解决方案。它继承了PlC单片机系列的哈佛总线结构和精简指令集(RISC)技术,以及寻址方式简单、运行速度快、功耗低、驱动能力强等优点,同时集成了主板级的DSP功能,能够提供强大的数字信号处理能力;此外,还提供了如UART、CAN、SPI等丰富的外围接口,可以方便地与其他设备进行通信互联。本文介绍使用dsPIC数字信号控制器的SPI接口与ISD语音芯片进行通信控制,使用的芯片型号为dsPIc30F6014。 2 ISD系列语音录放芯片    ISD系列语音芯片是美国ISD公司推出的产品。该系列芯片采用多电平直接模拟存储(Chip Corder)专利技术,声音不需要A/D转换和压缩,每个采样直接存储在片内的闪烁存储器中,避免了A/D转换的误差;能够真实、自然地还原语音、音乐及效果声;避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。ISD4000系列采用CM0s技术,内含晶体振荡器、防混叠滤波器、平滑滤波器、自动静噪、音频功率放大器及高密度多电平闪烁存储阵列等,只需要很少的外围器件即可构成一个完整的语音录放系统。它的操作命令通过串行通信接口(SPI)或Microwire送入;采样频率可为4.O Hz、5.3 Hz、6.4 Hz、8.O Hz,频率越低,录放时间越长,但音质会有所下降;片内信息存于闪烁存储器中,可在断电情况下保存100年(典型值),反复录音10万次;器件工作电压3 v,工作电流25~30 mA,音质好,适用于移动电话及其他便携式电子产品。本设计使用的芯片型号为ISD4002,单片录放时间为120 s。 3 SPI接口介绍    SPI是由美国摩托罗拉公司推出的一种同步串行传输规范,常作为单片机外设芯片串行扩展接口。SPI有4个引脚:SS(从器件选择线)、SDO(串行数据输出线)、SDI(串行数据输入线)和SCK(同步串行时钟线)。SPI可以用全双工通信方式同时发送和接收8(16)位数据,过程如下:主机启动发送过程,送出时钟脉冲信号,主移位寄存器的数据通过SDO移入到从移位寄存器,同时从移位寄存器中的数据通过SDI移人到主移位寄存器中。8(16)个时钟脉冲过后,时钟停顿,主移位寄存器中的8(16)位数据全部移人到从移位寄存器中,随即又被自动装入从接收缓冲器中,从机接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。同理,从移位寄存器中的8位数据全部移入到主寄存器中,随即又被自动装入到主接收缓冲器中.主接收缓冲器满标志位(BF)和中断标志位(SSPIF)置“1”。主CPU检测到主接收缓冲器的满标志位或者中断标志位置1后,就可以读取接收缓冲器中的数据。同样,从CPU检测到从接收缓冲器满标志位或中断标志位置1后,就可以读取接收缓冲器中的数据,这样就完成了一次相互通信过程。这里设置dsPIC30F6014为主控制器,ISD4002为从器件,通过SPI口完成通信控制的过程。 4 dsPIC的SPI函数库    dsPIC30F6014提供了2个SPI接口模块,每个接口模块包括三个特殊功能寄存器和四个引脚。SPIxBUF是数据缓冲寄存器。需要注意的是,接收缓冲SPIxRBF和发送缓冲SPIxTBF共享同一个地址,即它们都是地址映射到SPIxBUF的。也就是说,当对接收或发送缓冲寄存器操作时,都只能对SPIxBUF进行操作,而不能直接对SPIxRBF或SPIxTBF进行操作。SPIxCON是控制寄存器,用来对sPI模块的操作模式等进行配置;SPIxSTAT是状态寄存器,用来标示SPI模块所处的状态。其模块框图如图1所示。     通过对控制寄存器的配置,可以将SPI模块设置为8位或16位模式、主模式或从模式、帧同步等多种操作模式,还可以对时钟边沿、时钟分频倍数等进行配置。这里使用了以dsPIC为主,ISD为从的主从模式。Microchip提供的外围接口库可以方便地完成这些配置工作。    dsPIC Language Tools Libraries是MictoChip公司提供给开发者的一套工具库,其中主要含3个子库.DSP库,提供常用的DSP函数;外围接口库,提供对dsPIC系列所有外围接口的驱动函数,包括SPI接口;标准C及数学函数库,可在Microchip的官方网站下载(www.microchip. com)。我们使用其中的外围接口库中的SPI库函数即可。SPI库中主要包括以下几个函数:    ①configIntSPIx SPI中断配置函数。该函数可以对sPI接口的中断使能位以及中断优先级进行配置,返回值为空。    ②CloseSPlx关闭SPI接口。    ③DataRdySPlx SPl接口数据就绪。该函数用来判断SPI接收缓冲区中是否有数据等待读出。若返回值为1,表示缓冲区中数据已经就绪,等待读出;若返回值为0,则标示缓冲区为空。    ④ReadSPIx读SPI接口缓冲区。    ⑤WriteSPIx向SPI接口发送缓冲区写数据。    ⑥OpenSPIx打开SPI接口。该函数包含2个参数:configl和config2。configl中包含对SPI接口操作模式的配置信息,将写入控制寄存器;config2中包含SPI的状态信息,将写入状态寄存器。该函数在打开SPI接口的同时完成对其的配置。    ⑦puasSPIx函数将一个字符串数据写入到发送缓冲区中。    ⑧getsSPIx函数将从接收缓冲区读人指定长度的字符串数据,并转存到指定的空间。    除了这8个函数以外,该库还提供了相应的宏指令完成同样的功能,可以在程序中方便地使用。 5 lSD4002    ISD4002工作于SPI串行接口。SPI协议是一个同步串行数据传输协议,协议假定微控制器的SPI移位寄存器在SCLK的下降沿动作。对ISD4002而言,在时钟上升沿锁存MOSI引脚数据.存下降沿将数据送至MISO引脚.协议具体内容如下:    ①所有串行数据传输开始于SS下降沿;    ②SS在传输期间必须保持为低电平,在两条指令之间保持为高电平;    ③数据在时钟上升沿移入,在下降沿移出;    ④SS变低,输入指令和地址之后,ISD才会开始录放动作;    ⑤指令格式是10位地址码加6位控制码;    ⑥ISD的任何操作(含快进)如果遇到EOM或OVF则产生一个中断,该中断状态在下一个SPI周期开始时被清除;    ⑦使用读指令会使中断状态为移出ISD的MISO引脚时,控制及地址数据也同步从MOSI移入;    ⑧所有操作在运行位(RUN)置1时开始,置0时结束;    ⑨所有指令都在SS上升沿开始执行。    其时序如图2所示。     对于ISD4002,器件延时TPUD(8kHz采样时,约为25 ms)后才能开始操作;因此,用户发完上电指令后,必须等待TPUD.才能发出一条操作指令。下面是典型的操作。    从00处发音,应遵循如下时序:    发POWERUP命令;    等待TPUD(上电延时);    发地址值为00的SFTPLAY命令;    发PLAY命令。    器件会从00地址开始放音,当出现EOM时,立即中断,停止放音。    如果从00处录音,则按以下时序;    发POWER UP命令;    等待TPUD(上电延时);    发POWER UP命令    等待2倍TPUD;    发地址值为00的SETREC命令;    发REC命令。    器件便从00地址开始录音,一直到出现OVF(存储器末尾)时,录音停止。其工作时序如图3所示。 6 电路设计    本电路采用dsPICC30F6014数字信号控制器,通过3个按键开关控制ISD4002录放音芯片的动作。S1、S2、S3分别接到控制器外部中断INTl、INT2、INT3上。当按下S1时,开始录音,再次按下S1时停止录音。如此反复即可实现多段录音。同理,按下S2时开始放音,再次按下S2是停止放音。如此反复顺序播放多段录音。按下S3关机。(1)硬件电路设计    电路原理如图4所示。整个电路由语音录放电路、话筒输入电路、按键开关电路及LCD显示电路构成。由于本设计输出直接驱动普通耳机,经实验不需外部功放电路,直接利用ISD4002内部功放输出即可。ISD4002作为从机,其SPI接口的MOSI接控制器的SDO;MISO接控制器的SDI;SCLK接SCK;SS接控制器的SS即可。LCD用于人机交互的界面显示。 (2)软件设计    程序包括主程序以及几个子程序。主程序中,在完成初始化的工作之后,进入一个while循环,等待响应按键触发的中断,若有按键按下,则进入相应的中断服务程序。在按键S1的中断服务程序中,设置一个标志变量,Sl每按下一次,标志变量取反,用来控制录音及停止录音。同理,S2的中断服务程序中也设置一个标志变量,控制开始放音及停止放音。S3的中断服务程序中则发送Power-Down指令关机。程序清单中给出了主程序以及中断服务程序,另外包括LCD驱动程序以及dsPIC的SPI函数库等。(编者注:源程序见本刊网站www.dpi.com.cn。) 7 总 结    该电路易于实现,功能简单实用,可扩展性较好;输出声音清晰、自然。如要增加录音时间,可选用ISD4000系列的其他芯片,程序基本相同。另外,在设计过程中有以下几点事项需要注意:    ①在SPI的数据传输中,不同芯片所定义的传输顺序可能不同,因此要注意是先传高位还是先传低位。ISD4002要求先传高位数据,如果与主芯片所定义的顺序相反,则只要把指令码反过来传即可。    ②由于ISD4002要求在时钟前半个周期把数据放在传输线上,因此,在使用dsPIC的SPI函数库时需要注意SPI初始化。在本设计中,使用的配置为SPl—CKE—ON&CLK_P0L_ACTIVE_HIGH。    以上两点可能会帮助解决一些常见问题。

    时间:2006-08-10 关键词: spi 语音芯片 isd dsplc

  • ISD33000型语音芯片及其应用

    引言    语音记录芯片有很多种,但美国ISD公司的ISD系列芯片倍受广大用户的青睐,它采用直接模拟存储专利技术,把语音信号以原始的模拟形式直接存储在片内的EEPROM存储器中,无需进行A/D转换和压缩处理,没有大多数固态数字化声音存储技术对声音质量的影响,从而减少了失真,大大提高了录放音质量,并具有抗断电、音质好、使用方便、可反复录放,无需专用的语音开发工具,能随意更改内容和耗电省等优点,很适合于现场录放音系统。    ISD系列语音记录芯片广泛应用于自动化通信系统、移动电话、智能仪器及其他需要语音提示的各种电子产品中。本文介绍了ISD33180在一种可以进行心音记录的电子听诊器中的应用。 图1 ISD33000系列封装图 ISD33000的介绍    ISD33120/150/180/240系列是采用3伏电源供电的单片语音录/放设备,可存储2.0、2.5、3.0至4分钟的语音信息。四种型号的不同录放时间是靠不同的输入采样率来实现的,他们分别是8.0、6.4、5.3、4.0kHz。该CMOS工艺芯片包含一个内部时钟振荡器、抗混迭滤波器、平滑滤波器、自动选择器、音频放大器和高密度多层存储阵列。ISD33000系列的EEPROM的容量都为960K,可存储800行语音信息。    ISD33000系列具有TSOP和DIP/SOIC两种封装形式,如图1所示。SS 片选信号(低电平允许芯片工作);MOSI 串行数据输入端;MISO 串行数据输出端;SCLK 串行时钟信号; VCCA、VCCD模拟和数字电路电源端;VSSA、VSSD模拟地和数字地;AUD OUT 音频信号输出端,可驱动5kΩ负载;AM CAP 自动静噪控制端;ANA IN-、ANA IN+ 模拟信号输入端,模拟信号可以采用单端输入和差分输入两种方式;RAC 行寻址时钟,当达到存储器每一行的末尾时该引脚保持137.5ms的高电平和12.5ms的低电平,可用于信息管理;INT 中断端(低电平有效);XCLK 外部时钟输入端。    一组四线(SCLK,MOSI,MISO,SS)SPI接口提供了ISD33000系列的控制和寻址功能。ISD33000系列产品的构成就如在操作一个基于微控制器SPI总线接口的外围设备。对于所有的内部记录器的读写允许操作都是通过SPI接口实现的。数据转换方面的约定是,微控制器的SPI转换锁存器在SCLK的下降沿处锁定,对于ISD33000设备,MOSI引脚上的数据在SCLK的上升沿处被锁定,内部数据在SCLK的下降沿处被锁定输出到MISO引脚上。中断信号(INT)和内部的只读状态记录器是为了提供握手信号的目的。控制位和地址位的分布如下:〈5位控制位〉和〈11位地址位〉。需要说明的是ISD33120/150/180/240设备只需要10位地址位,但为了录音时间更长产品的需要保留了第11位。对于每一个以EOM和OVF结束的操作,包括信息检索周期,都将产生一个中断。这个中断将在下一个SPI周期有效时被清除。 表1 控制位摘要应用举例    所设计的电子听诊器对拾取心音的操作与普通的录音机相似,可以播放、记录,还可以在各段记录间搜索。这里采用89C51型单片机作为语音芯片的控制器,用户的意图通过按键来表达。    各指令与控制位的关系如表1所示。ISD33000设备启动要经过TPUD时间后才可进行操作(对于采样频率位8kHz的产品来说,约为25ms)。用户在发出操作命令之前要等待TPUD的时间。以播放操作为例,从地址address开始的播放操作应按下述的步骤进行:发出POWERUP命令;等待TPUD时间(启动延迟时间);发出从地址address的SETPLAY命令;发出PLAY命令。当发现EOM标记时产生一个中断,然后停止播放操作。     该应用中单片机的P1端口设计为人机接口,P2端口为单片机与语音芯片的通讯口。P1口的按键依次为:K1键为播放记录选择键(P/R);K2键为开始键(START);K3键为停止键(STOP);K4键为前倒键(PRE);K5键为后倒键(NEXT),其中K1键为拨动开关,其余各键均为不可自锁的按键,发出脉冲信号。P2口依次连接33180的SCLK、MOSI、MISO、SS和RAC引脚,在记录操作期间,存储的信息达到存储阵列的每一行末尾时,RAC端会发出长度一定的高脉冲,单片机此时将地址变量加一,记录语音芯片的地址信息。在每段语音信息的末尾,语音芯片会发出一个中断,将该中断信号送入单片机外部中断0的输入端。    在没有要求单片机工作之前,单片机处于循环查询状态,一旦P1端口的K2、K4、K5、K6键有信号发出,指针表会跳转至各自子程序执行相应的操作。以播放操作子程序为例,先后向语音芯片发出POWERUP命令,SETPLAY命令和PLAY命令,然后进入等待状态查询P1.2端口STOP键是否有触发,如有触发则终止播放操作,进入循环查询部分。播放操作的正常结束是通过外部中断0的中断子程序。播放子程序清单:PLAY: MOV OISTO1, #20HLCALL TRANS ;发出POWERUP命令MOV TMOD , #01HMOV DPTR ,#25536MOV TH0, DPHMOV TL0, DPLSETB TR0 JNB TF0,$ ;等待TPUD40ms时间MOV OISTO, PFROMMOV OISTO1, PFROM1;读取播放记录的首地址ANL OISTO1, #07HORL OISTO1, #0E0HLCALL TRANS ;发出SETPLAY命令ORL OISTO1, #0F0HLCALL TRANS ;发出PLAY命令MOV IE, #81HHERE: JB P1.2, OVER ;如果要求中止则结束SJMP HEREOVER: MOV OISTO1, #10HLCALL TRANS;发出STOPPWRDN命令LJMP SELECTINTX0: MOV IE, #0 LJMP OVER ;播放结束返回RETI注:TRANS 为单片机与语音芯片的通讯子程OISTO和OISTO1为存储控制位和地址的寄存器SELECT 为循环查询子程INTX0为中断子程    其他记录子程序,前倒子程序和后倒子程序与播放的程序相似,在此不再赘述。 ISD33000使用中应注意的几个问题·ISD器件的音频信号输出功率很小,并不能直接驱动扬声器,需要加音频功放,如LM386。同时ISD送出的信号需通过电容耦合,隔离直流分量,以免其饱和。·应注意RAC端口,每完成一行的录音、放音及搜索操作,该端口输出一个正脉冲。单片机检测到此正脉冲,对应当前的行地址,可用于对录放信息的精确定位。·当中断数据从ISD33000设备的MISO引脚移出时,控制位和地址位同时移入MOSI引脚。所以应注意传送的数据是否符合当前系统的操作。

    时间:2006-10-31 关键词: 语音芯片 isd 33000

  • 语音芯片APR9600及其在电话遥控系统中的应用

    语音芯片APR9600及其在电话遥控系统中的应用

    摘 要: APR9600是采用模拟存储技术的新型语音处理芯片。给出了APR9600的引脚功能及典型应用电路,重点阐述了其与单片机AT89C51构成的电话遥控系统的设计。关键词: 语音处理 单片机 电话遥控       近年来,数码语音处理技术领域已逐渐发展成为两大阵营——传统的数字语音技术和新型的模拟语音技术。前者是将语音信号经模数转换(A/D)变成数字代码,存储到各种数字存储器(ROM,SROM,EEPROM等)中,还原时再经数模转换(D/A)合成近似的模拟语音,其音质相对较差,结构较复杂;而新型的模拟语音处理技术是直接将语音模拟量存取于特殊的非易失模拟存储器中,其音质效果好,结构简单。语音录放芯片APR9600就利用了后一种技术——新型的模拟语音处理技术。       录音时外部音频信号经芯片APR9600内部具有自动增益调节的话筒放大器放大,由内部滤波器、采样电路处理后以模拟量方式存入专用快闪存储器 FLASHRAM中,由于FLASHRAM是非易失器件,长时间断电语音不会丢失。放音时芯片内读逻辑电路从FLASHRAM中取出信号,经过一个低通滤波器送到功率放大器,然后直接推动外部的喇叭放音。       1 引脚功能       APR9600为28脚双列直插式标准封装DIP芯片,各管脚功能说明如表1所示。       APR9600工作电压4.S~6.SV,静态电流1uA,工作电流2SmA,驱动功率12mW(外接喇叭16Q)。     2 控制模式及典型应用电路       APR9600典型应用电路如图1所示。APR9600的录放控制有多种模式,为普通用户使用提供了极大的方便。总的来说分为串行控制和并行控制两种模式,由芯片MSEL1、MSEL2及/M8的设置来实现,对应关系如表2所示。  在并行控制模式下,每段都有对应的键控制,任意一段的录放不影响其它段,控制简单,最多可分八段,适用于几段语音之间各不相关,毫无顺序可言的场所;在串行控制模式下,语言按一定的顺序录放,控制键少,分段控制不方便,适用于几段语音之间互相关联,有一定先后顺序的情形。      3 在电话遥控系统中的应用       笔者设计并制作出一种多路电话遥控器,通过它人们可以随时随地地用电话对多种家用电器进行开关控制及定时功能。由于电话线路各地联网遥控距离可跨省市。本系统采取单片机控制利用语音芯片实现双工通信,达到对于不同操作的提示及对受控方状态的信息反馈,从而使操作者能够及时了解受控方信息,使产品达到交互式与智能化。       整体电路框图如图2所示。整个电路除了以AT89CS1为主控CPU单元外,还有振铃检测,模拟摘机,双音多频解调,语音芯片控制,电器驱动单元等。       该系统APR9600被预先设置为八段的并行控制模式,在设计时将APR9600的“MSEL1”,“MSEL2”,“/M8”端均置1(接正电源)。置 RE端为录音状态,按住/M1即开始录第一段,松键即停止。再按/M2即录第二段,如此下去按住/M8即录第八段。本系统所录制的八段语音如表3所示。       相应语音段的播放由软件触发。此语音芯片SP+,SP-端,接至电话线,反馈到电话听筒里,用户可从电话里听到系统控制语音芯片发出的提示进行相应的操作。        软件的总体结构共分五部分:(1) 系统初始化;?(2) 铃流检测;?(3) 密码比较;?(4) 通道通/断;?(5) 修改密码。流程如图3所示。       下面介绍本系统中对有限语音资源的分配技巧,主要介绍如何用两段语音实     现8路受控控设备状态的语音反馈。按正常思路每一路受设备应有操作前状态和操作后状态两段语音提示,8路设备需16段语音。实际程序设计时,用一字节的RAM单元寄存八路受控设备状态,如表4所示。       该RAM单元的8位分别代表8路电器设备的状态(1表示开,0表示关)。通过软件查询修改该RAM单元对应的二进制位,为1时,反馈语音“该路电器已经开启”,为0时,反馈语音“该路电器已经关闭”。限于篇幅,具体程序省略,这种设计方法对其它型号的语音芯片同样适用。     参考文献      1 项新建.语音芯片WS1300与单片机的控制技术.微型机与应用?1999:18(4)      2 北京中青世纪科技发展公司.语音芯片及其应用电路资料汇编,1999

    时间:2008-05-30 关键词: 电话遥控 9600 语音芯片 apr

  • 基于ISD2560语音芯片的录放电路设计

    0 引言ISD系列语音电路是美国ISD(InformationStorage Device)公司的专利新产品,该器件打破了传统的先A/D再D/A模式,而采用独特的直接存储模拟信号技术,从而大大提高了存储密度,并且可将模拟信号永久保存。ISD系列电路以其音质自然、使用方便、单片存储、反复录放、低功耗、抗断电等众多优点已在语音应用领域确立了其不可争辩的地位,目前,它已在通讯设备、智能仪表、治安报警、语音报站、报数报价、语音讲解、语音记录、语音复读、教学仪器、智能玩具、电子礼品等领域获得了广泛的应用。本文用单片机89C2051和ISD2560设计了一款微电脑语音板,从而实现了语音的分段录取和组合回放。也可通过修改软件来实现整段录取和循环播放。本产品可作为语音服务系统的子系统,而不必使用专门的ISD语音开发设备。1 ISD2560的语音录放电路构成ISD2500系列语音芯片可通过SPI协议方便地与CPU接口。本文用ISD2560芯片构成的单片机通用开发板采用国内最常用的MCS-51语言单片机89C51,来与ISD2500系列语音芯片相结合,可供用户开发各种新型智能型数码语音产品。该开发板上已装配好的器件包括:◇AT89C2051单片机,该器件内含8031内核、4 KB可反复擦写的程序存储器,以及32条I/O口,并采用5 V电压工作;◇ISD2560语音芯片,采用音质优异的模拟存储技术,可反复录放60秒;◇LM386功率放大器,具有0.5 W驱动能力;AT24C01(选配件)I2C总线串行存储器;此外,板上还有驻极体话筒(MIC)、话筒放大器、音量电位器、发光管等部件。当板子工作时,该板的外接电源电压为12 V(稳压),外接喇叭为4~16 Ω/0.5 W,工作电流在录音时为25~30mA,在放音时为50~80 mA,静态电流为13 mA,同时随板提供有演示程序功能等配套软件。2 ISD2560与单片机的接口电路ISD2560的A0~A9为地址线,它共有1024种组合状态。最前面的600个状态通常作内部存储器的寻址用,最后256个状态用作操作模式。本系统采用对地址直接进行操作的方式进行设计。在本系统与微处理器的接口中,P/R录放音控制端在高电平时,为放音状态,低电平时为录音状态;P3.5、P3.7端用于录放音时的启停控制,通常与P/R端配合使用;P3.4端为每段信息结束信号输出端,该信号为负向信号,时间为12.5ms,其上升沿标志信息结束。系统中的MIC是话筒前置放大器输入端;MIC REF为话筒补偿端,AGC为自动增益控制端;ANA IN与ANA OUT是模拟信号的输入和输出端,它们之间连接的耦合电容通常取值为0.22~1μF。本系统中基于ISD2560的语音录放电路如图1所示。一般情况下,可将单片机的P1口、P3.4和P3.5与ISD2560的地址线相连,用以设置语音段的起始地址。P3.0~P3.3用以控制录放音状态。P3.7为扩展录音键,可供录音时使用。3 系统工作原理及程序设计ISD2560虽然提供有地址输入线,但它的内部信息段的地址一般无法读出。因此,通常使用不需要知道地址的操作模式。但要读出ISD2560内部信息地址,就需要专用的ISD开发设备,而这些设备的价格比较昂贵。为此,本系统采用单片机来控制。该方法不需读出信息地址,而是直接设置信息段起始地址。该设想的实现方式有多种。第一种方式由于ISD2560的地址分辨率为100ms,所以,可用单片机内部定时器定时100 ms,然后再利用一计数器对单片机定时次数进行计数,这样,计数器的计数值就是语音段所占用的地址单元。该方式能充分利用ISD2560内部的EEPROM,故在字段较多时可利用该方法;而如果语音字段较少,则可用第二种方式:即根据每一字段的内容多少直接分配地址单元。一般按每1 s说3个字计算,60 s可以说180个字,然后再根据ISD2560的地址分辨率为100 ms,计算出语音段所需的地址单元数。本系统即采用该方式。3.1 AT89C2051对ISD2560的录放音控制录音时,先按下录音键,由单片机通过口线设置语音段的起始地址,再使PD端、P/R端和其它相关端口为低电平以启动录音;录音结束,单片机又让这些端口回到高电平,以完成一段语音的录制。然后以同样的方法,也可录取第二段、第三段、等等。值得注意的是,录音时间一般不能超过预先设定的每段语音的时间。放音时,可根据需播放的语音内容,找到相应的语音段起始地址,并通过接口线送出。然后将P/R端设为高电平,PD端设为低电平,并让其产生一负脉冲以启动放音,这时单片机只需等待ISD2560的信息结束信号(即EOM的产生)。由于该信号为一负脉冲,且在负脉冲的上升沿,该段语音才播放结束,所以,单片机必须要检测到该上升沿,才能播放第二段,否则,播放的语音将不连续,而且会产生啪啪声,这一点在编制软件时一定要注意。图2所示是其录放音程序框图。其具体的操作方法如下:(1)录音将跳线插在“REC”一侧,即为录音状态,按下“REC”键,指示灯亮,即可对着板上话筒讲话录音,松键时,录音停止并形成一段。再次按下,则录下一段。操作时,按“STOP”键为复位,再录音时,又将从第一段开始。(2)放音将跳线插在“PLAY”一侧,为放音状态,此后,按一下“PLAY”键即播放一段,一段结束后自动停止放音,再按“AN”,则播放下一段。操作过程中,按“STOP”键为复位,再放音时,又将从第一段开始。3.2  程序设计本程序是以AT89C2051为ISD2560的控制器,晶振频率为12 MHz来编写的。下面给出录取语音信息的录音程序以及对这段语音进行播放的源程序。实际上,播放时也可根据实际情况组合回放。需要时,还可对该程序进行扩充。其ISD2560语音录放系统程序如下:此后,在录音时,第一次按录音键即开始录音,第二次按录音键表示暂停(即保存,设置EOM)。暂停录音后,按放音键,可从地址指针为0处开始放音。录音时,可通过PD(引脚P3.1)端的高脉冲来停止录音。播放时,第一次按播放键即开始播放。播放过程中,再次按播放键则可暂停,第三次按播放键可以在暂停处继续播放。如在第二次播放键按下后,再按录音键,则可从暂停处开始录音。播放中,可通过PD(引脚P3.1)端产生的高脉冲来停止播放,同时将地址指针复位到0。播放中没有PD高脉冲,则一直播放下去,直到遇到芯片溢出处时,再返回地址指针为0处,开始循环播放。下面是其录音子程序:系统的播放子程序如下:停止录音或播放子程序如下:系统初始化程序:10ms的延时程序:30ms的延时程序:120 ms的延时程序:4 结束语本语音录放电路具有结构简单,成本较低,调整方便,可靠性高等优点。实际使用证明。该系统能够满足正常语音录放要求。而且,通过适当调整,也可以用于其它语音录放的场合。

    时间:2010-06-24 关键词: 2560 语音芯片 isd 录放

  • AMD前芯片研发总监经过2年努力研发一款超越Intel/NVIDIA的AI视觉芯片

    AMD前芯片研发总监经过2年努力研发一款超越Intel/NVIDIA的AI视觉芯片

    新一轮的AI热潮让一批创业者努力为自己贴上AI标签以便搭上这一波热潮的红利,当然也有一批创业者在AI热潮到来之前就早有准备。AI芯片就是许多早有准备的创业者看好的创业方向,他们想要为AI语音或视觉提供更好的芯片,从目前的情况看,AI视觉芯片领域的竞争相对激烈。值得注意的是,由AMD前芯片研发总监带领的团队用时两年多研发了一款声称超越Intel Movidius MyriadX和Nvidia Tegra X2的AI视觉芯片,事实果真如此? 世界第一的AI视觉芯片来自初创公司 伴随AI的热潮,全球范围内无论是传统芯片巨头、科技企业还是初创公司都对AI芯片有非常高的热情。Intel在2016年收购了硅谷初创视觉处理公司Movidius增强了其在视觉芯片领域的实力,Nvidia也有图像性能强大的Tegra移动处理器。国内,地平线机器人、NextVPU、耐能、云天励飞、寒武纪科技等都是AI视觉芯片创业公司的代表。 越来越多公司的加入也让AI视觉处理器市场的竞争变得越来越激烈,NextVPU(肇观电子)CEO冯歆鹏表示:“AI视觉处理器是一个正在兴起的市场,无论是对巨头还是创业企业都非常重要。我们判断视觉处理器的市场规模未来一定会超过CPU市场。” 他同时表示:“目前的时间点比较有意思,市场的需求已经起来,但芯片处理AI视觉需求的时候速度慢且开发痛苦,价格也很昂贵。如今这个市场还是比较蓝海的情况,英特尔和英伟达这样的芯片巨头在往前走,但是他们的进展相对慢一些,因为新兴的市场规模还比较小,大公司往往是做大市场服务大客户,新兴市场难以撑起大公司的整个项目。从历史的经验看,这种科技变革的节点小公司更有优势。在AI视觉处理器领域,可以说目前我们微微领先。” 冯歆鹏口中微微领先的AI视觉芯片就是被称为世界第一的AI视觉处理器NextVPU N171,这个第一如何理解?冯歆鹏表示,在端侧,我们的AI视觉处理器的几何引擎每秒能计算2.48亿个3D点,这个结果把目前世界领先的的水平推进了一大步。另外,N171的CNN引擎跑深度神经网络例如ResNet的结果也比Nvidia Tegra X2高好几倍。每秒3D点云的性能也比Intel Movidius Myriad2、Nvidia Tegra X2高几倍,还支持其它AI视觉处理器不支持的像素级理解和语义分割。 这家推出被称为世界第一AI视觉处理器的公司是创立于2016年5月的NextVPU,不过NextVPU创立之初首先推出的是辅助盲人感知世界和出行的智能眼镜,原因从冯歆鹏创业的历程就能找到。冯歆鹏在创业前担任AMD的研发总监,与创业搭档周骥博士在大概2012年的时候就开始关注计算机视觉的方向,到了2016年他们觉得很多机会都已经出现,不能再继续等下去,最后两人就在2016年创立了NextVPU(Next Vision Processing Unit, 未来的视觉处理器),中文名为肇观(有开启视觉的含义),冯歆鹏担任CEO,周骥担任CTO。虽然从创业之初就准备做芯片,但他们觉得2016年整个行业还没起来,单一的环节做得好没什么用,因此不得不先做一个产品。当然,从他们创业的第一天开始就在为芯片做准备,也就后来N171里的核心自研IP。 为何能开发出超越芯片巨头的AI芯片? 从数据上看,NextVPU N171可以被称为世界第一的AI视觉芯片,不过更让人关注的是初创公司为何能打造出超越芯片巨头的终端AI视觉芯片?这需要从NextVPU N171芯片的定位到功能去理解,创业之前冯歆鹏就已经明确了要做一款AI视觉芯片,但AI芯片可以分为云端和终端芯片,不同的选择将面对不同的市场竞争。冯歆鹏表示,云端和终端都有很多机会,从英特尔的收入分布看终端和服务器芯片的收入比约为5:1,其中服务器芯片出货量少、单价高利润率也比较高,但是这一市场竞争非常激烈,几乎是巨头垄断,更适合较大的企业。终端芯片无论是市场总量还是芯片需求量都远大于服务器市场,并且终端市场更具多样性,用户的需求也有一定的差别,小公司进入和发展都比较有利。 选择了终端市场之后,接下来需要定义产品功能。冯歆鹏指出,计算机视觉面临几何和理解两大挑战,当然,无论是几何还是理解都有大量的需求,比如客户想通过3D环境扫描做一个模型构建地图,或者生产线上不同的零件区分,这就需要VSLAM、多目、结构光、TOF等技术,也需要CNN识别,检测和分割等技术。看到这些需求并且了解到如今的芯片不能满足需求之后,我们芯片的功能大概就确定了。 因此,NextVPU N171具备的一大特色就是集成了三个自主IP:几何引擎、深度神经网络引擎(CNN)、图像成像引擎(ISP)。几何引擎用于同时处理传感器获得的数据、坐标空间信息、时间等多输入的信息,也就是对三维点组成的点云做各种计算,这是所有VSLAM三维重建的基础,机器人、汽车、AR和VR领域等对此都有急迫的需求。据悉,N171几何引擎每秒能处理2.48亿个3D点,处于业界领先的水平。 深度神经网络引擎支持图像的检测识别、分割以及各种主流的CNN算法。模型从简单到复杂,逻辑从几层到几百层都支持。冯歆鹏强调,深度神经网络引擎我们花了很长时间去做,并且跑越复杂的模型我们的深度神经网络引擎的利用率越高,越流行的网络模型,利用率也越高,几乎可以达到理论极限。 视觉成像引擎则是对图像进行处理,为了能够让机器看懂世界,视觉成像引擎做了非常多特殊的处理的调教,动态范围可以做到150dB,这是基于机器视觉的需求所决定。 除了三大自主IP,N171还有一大特色就是可独立运行操作系统,这个功能是通过N171中的多核CPU来实现。对于这个功能,冯歆鹏表示许多用户习惯于用像Linux这样的操作系统做文件的存储和调取,然后做日志,而非使用特殊的轻量级内核。要实现这个功能,有两种方式,一种是分布式的做法,在常用应用处理器AP芯片的基础上增加一个AI协处理器,第二种方式是异构融合,也就是将两个芯片做集成。 “我们接触到的所有客户都倾向于第二种方式,所以我们集成了多核CPU能够运行操作系统,让我们的芯片既能满足传统需求,也有很好地AI性能。另外,集成度越高,芯片内部的数据传输及交换的成本也能越低。”冯歆鹏补充表示。 由此不难看出,发现市场的痛点和需求之后,根据客户的需求一步步明确产品的形态和功能打造满足市场需求的产品,通过自研的IP,以ASIC芯片的形式实现,N171最终获得比传统芯片巨头性能更强的芯片自然也就可以理解。不过,对市场需求的正确判断以及好的产品理念还不足以让一款芯片成功流片,背后的团队也非常关键。 冯歆鹏和周骥都来自AMD,我们知道AMD是提供CPU,也能提供GPU的高性能计算芯片公司,而AI需要的就是高性能芯片,因此从Intel、Nvidia、AMD这三家高性能计算芯片公司出来的团队在做AI芯片的时候在经验上更具优势。冯歆鹏参与过50多款CPU和GPU的设计,对于高性能计算芯片里的流水线设计、数据的分布式存储处理等都非常有经验。除了基于已有的经验积累用两年多的时间先做IP然后做SoC,N171在其他方面也有巨大的投入。 能否成功落地? 在设计、功能都能够满足市场需求之后,芯片的实际性能成为考验一款芯片能否成功落地的关键。对于N171这样的高性能芯片,无法回避的问题就是高性能带来的高功耗。冯歆鹏表示:“一款芯片的设计只要遵循规则不出错,性能和功耗的实际值和理论值基本会遵循一条曲线。我们产品的性能和功耗水平同样基于客户的需求,根据客户产品设计的电池容量以及他们期望的续航时间,可以推导出芯片功耗的具体水平,只要功耗不大到一定的程度客户都能够接受。当然N171的性能和功耗也可以调教,不同的时钟频率对应不同的功耗,也可以根据客户的需求进行配置。“ N171虽然是高性能芯片,但并没有采用最先进的7nm工艺,而是选择了28nm工艺,这主要是从市场的角度出发,使用成熟的28nm工艺的性能和功耗就能够满足这款芯片目标市场和客户的需求。 而在N171芯片的目标市场之中,汽车市场对于芯片的稳定性、实时性、安全性都有更高的要求。为了进入这一市场,冯歆鹏表示:“我们的芯片首先满足ISO TS16949、AEC-Q100两个车规标准,也正在做ISO26262标准。另外,汽车市场比消费市场和工业市场有一些差异化的需求,比如需要支持零下40度到零上125度的温度,还要求芯片在出现错误之后能够自己恢复和校准。因此我们用更好的封装材料保证其稳定性、测试的流程也更加复杂。基于之前设计波音飞机上使用的CPU的经验,我们对这些都很有经验,只是需要付出更多的时间和成本。” 至于火热的安防市场,他们A轮的领投方是中电海康基金,这个基金背后是中电科技集团和中电海康集团。中电海康集团下属的海康威视是国内安防领域的龙头,他们在积极布局智能摄像头,NextVPU N171里的很多设计和功能也是为安防考虑。 既然基于相同晶圆和裸片的N171能够满足汽车和工业市场的需求,那么消费级市场当然也是NextVPU不会错过的。据悉,N171的第一代芯片已经成功流片,测试的结果也非常好,现在正处于客户导入的阶段,距离正式的上市还有几个月时间。冯歆鹏透露目前的合作客户已经涵盖车载、安防和机器人,希望未来N171还能做第二代、第三代,持续做下去。 在AI的热潮下,许多有经验有实力敏锐的大咖都开始了创业,他们希望能够在新的浪潮里发挥更大的价值,很显然NextVPU的团队就属于这一的创业团队。在技术、产品都能够比肩芯片巨头的情况下,芯片的实际落地更考验创业团队,在这个过程中会遇到很多意想不到的事情。相信我们都愿意看到NextVPU的产品能够不断迭代,为计算机视觉领域带来更好的AI芯片,也能够增强中国芯片的实力。

    时间:2018-10-23 关键词: 芯片 ai芯片 新品发布 语音芯片

  • 猎户星空联合瑞芯微发布AI语音芯片

    猎户星空联合瑞芯微发布AI语音芯片

    近日,猎豹移动旗下的人工智能公司猎户星空联合瑞芯微电子发布了专门针对智能语音和物联网设备的 AI 芯片OS1000RK。 猎户星空表示,OS1000RK是业内首款全链条 AI 语音芯片,目前,该芯片已经成功落地到小雅Nano智能音箱中,并预计将在今年年底达到百万的出货量。 据悉,OS1000RK采用64λ 4 核ARMCortex-A35 ,整合了8通道ADC+2通道DAC的 CODEC,可以非常低成本地支持多达 8 个麦克风阵列。 猎户星空表示,OS1000RK主打功耗低、通用性强,能够实现从语音唤醒、语音理解、语音合成等全链条的语音交互能力。一键式解决智能硬件产品语音AI化的需求,且在价格和性能上具有非常强的竞争力。 猎户星空成立于 2016 年,是猎豹移动投资的人工智能公司。目前,猎户星空已经搭建了由数十名芯片行业资深专家组成的AI芯片开发团队。两年多的时间里,猎户星空搭建了全自研的猎户机器人平台Orion OS,目前ÿ天语音指令请求已经超过3000万次,拥有数百万小时的远场语音数据积累,覆盖用户数将近1亿。 猎户星空首席战略官王兵表示,如今芯片行业的核心能力已经不再单纯是硬件的竞争,而是包括硬件在内的全栈技术能力的竞争。δ来,猎户星空还将结合专业化的场景,发布视觉、导航等更多领域的专用芯片。

    时间:2019-01-23 关键词: 猎豹 ai芯片 新品发布 语音芯片

  • 语音芯片市场愈发火热,联发科2018能否胜券牢握?

    语音芯片市场愈发火热,联发科2018能否胜券牢握?

    随着苹果(Apple)、亚马逊(Amazon)、微软(Microsoft)、Google、阿里巴巴及腾讯等国际大厂纷备妥新一代语音界面及智能语音装置新品,台系IC设计业者预期,2018年全球智能语音装置品牌业者出货量目标,可望较2017年翻倍成长,甚至基期低的业者,将呈现出货三级跳的走势,面对客户新品将自第3季底开始陆续问世,智能语音装置相关芯片订单开始扶摇直上。 尽管2018年上半全球智能语音装置市场只有苹果旗下第一代HomePod重装上市,且截至目前HomePod销售表现远不如预期,似乎让智能语音装置市场热度降温不少。 不过,包括亚马逊、微软、Google、阿里巴巴及腾讯等全球网络巨头,对于终端智能语音装置产品的热爱程度仍直线上升,近期不断砸下重金、资源及人力强化自家语音界面功能,并备妥最新一代的语音界面及智能语音装置新品,将在2018年下半传统旺季全面展开冲刺。 联发科在2017年为全球智能语音装置芯片市场的最大赢家,2018年乘胜追击的动作已在预期之中,不仅亚马逊、Google及阿里巴巴都已是联发科重要的合作伙伴,连苹果、腾讯亦传出向联发科请益的动作。 面对2018年联发科新一代智能语音装置芯片平台拥有更强大的运算效能,更稳定的网络连结,以及更低的功耗省电设计,2018年联发科智能语音装置芯片总出货量要再成长逾50%,并继续拿下全球智能语音装置芯片市占率50%以上的佳绩,几乎已是胜券在握。 由于未来几年全球智能语音装置芯片市场的复合成长率仍高,近期不少台系IC设计业者出现积极布局的动作,包括瑞昱、立积的Wi-Fi与RF芯片,宏观电的蓝牙5.0芯片解决方案搭配新唐的MCU,以及钰太的MEMS麦克风芯片,台系芯片业者齐聚全球智能语音装置芯片市场的举动,凸现此一市场商机相当可期。 芯片业者指出,未来人工智能(AI)时代语音界面将成为重要人机界面,甚至是主要的人机界面,此一发展趋势愈益明显,尤其语音界面将串连云端服务、大数据、人工智能、物联网等多项时代交替的杀手级应用功能,让全球科技供应链纷为之疯狂。 由于智能语音装置扮演语音界面重要的市场试金石,国内、外各大网络业者、软件大厂及消费性电子品牌业者纷全力抢攻全球智能语音装置市占率,因为使用者习惯及消费性体验,将是卡位新时代人工智能、云端服务市场商机的不败法门。 因此,2018年全球智能语音装置市场将呈现新品齐发的景况,甚至开始分为高、中、低端产品市场区隔,未来每年超过1亿台的智能语音装置市场商机,让提前卡位的台系IC设计业者完全不用担心找不到新的业绩成长动能,甚至预期智能语音装置芯片的毛利率,将优于原先产品线甚多。

    时间:2018-07-05 关键词: 芯片 AI 语音芯片 行业资讯

  • 带你领略芯片设计,语音芯片设计介绍

    带你领略芯片设计,语音芯片设计介绍

    芯片设计的理论知识,在往期芯片设计相关文章中已有所涉及。对芯片设计了解不多的朋友,可以参阅哦。本文中,将介绍基于FPGA的ISD语音芯片设计。希望大家在这篇芯片设计文章中,可以有所收获。 1 引 言 FPGA(现场可编程门阵列)的出现,改变了数字系统设计方法、增强了设计的灵活性,同时,在基于芯片的设计中可以减少芯片数量,缩小系统体积,降低能源消耗,提高系统的性能指标和可靠性,在实时监控方面有广泛的应用。 ISD语音芯片采用DAST(直接模拟存储技术),直接存储模拟信号,因而减少了失真,提高了录、放音质量,本文所用的ISD2560系列具有抗断电、音质好、使用方便、录放时间长等优点。然而,在产品应用中,大多数系统只利用了ISD芯片提供的无需地址的工作模式(共有6种),这些操作模式实时性差、地址控制精度不高、操作不灵活。本文从另一个角度论述了基于FPGA的ISD语音芯片的设计开发。 2 ISD语音芯片 ISD语音芯片目前有ISD1000、ISD1100、ISD1200/1400、ISD2500、ISD3340和ISD4000系列,本设计采用的是2500系列中的ISD2560芯片。ISD2560具有10个地址输入端,寻址能力可达1024位,前600个地址用于直接存取语音,地址600~767未使用,地址768~1024为工作模式选择用,因此最多能分600段;设有OVF(溢出)端,便于多个器件级联;单片存储时间为60秒,直接存储模拟语音信号。 ISD芯片的地址以信息段为基本组成单元,只要在分段录、放音操作前(不少于300ns),给地址A0~A9赋值,录音及放音功能均会从设定的起始地址开始,录音结束由停止键操作决定,芯片内部自动在该段的结束位置插入结束标志(EOM);而放音时芯片遇到EOM标志即自动停止放音。 3 硬件构成及实现方案 利用FPGA的可编程特性实现对ISD2560芯片的直接地址操作,从而实现按地址位录音、放音的功能,提高芯片存储空间的利用率,并能自由选择存储地址;本文选择XILINX(全球最大的可编程器件供应商)的Spartan XL系列芯片,利用VerilogHDL语言编程设计,采用层次设计方法实现。 Verilog HDL是一种硬件描述语言,用于从算法级、门级到开关级的多种抽象设计层次的数字系统建模。数字系统能够按层次描述,并可在相同描述中显式地进行时序建模。 3.1 设计思路 ISD2560芯片存储时间是60秒,内部有480K字节的EPROM存储单元,划分为600个地址单元,可以算出对于每一个地址单元的存储空间是480K÷600=800字节,对应的录放时间是100ms;同时,ISD2560内部的地址位从0~599对应这600个地址单元,其它地址位则在操作模式或按键模式中使用。可见,芯片内部上下段之间在存储空间上不  连续,但在地址上具有连续性。所以,ISD芯片内部的地址可采用定时计数器的方法获得,并可采用直接地址法提取此地址段,实现实时控制、自由存储。3.2 系统总体结构设计(顶层设计) 基于FPGA的ISD2560语音芯片的设计开发主要完成两个功能:(1)触发或停止FPGA内部定时计数器计数,并将计数结果存入FPGA的内部存储器中;(2)利用直接地址法,提取用于ISD芯片录、放音所需地址。 本系统是基于XILINX FOUNDATION 3.0平台开发的,其中: RECORD模块用于处理录音和停止录音的操作,产生触发或停止定时计数器的信号以及录音时片选信号; TIME模块利用FPGA的内部时钟模块最高频率产生频率为10Hz的信号作为计数器的时钟;为了提高系统的精确性,也可以通过外加时钟的办法实现。 COUNTER模块为定时计数器,它利用周期为100ms的时钟脉冲,根据录音长短算出ISD芯片地址位,并发送到存储器,其Verilog HDL语言编程实现如下: P/R模块产生整个电路录、放音的选择信号;PLAYADDR模块完成放音地址的产生; PLAY模块将在放音时产生一个由高到低的脉冲作为片选信号; ROM10模块完成了存储器的功能,存储10位ISD芯片地址,并按照PLAYADDR产生的地址直接提取ISD芯片地址,其Verilog HDL语言编程实现如下: module roml (addr,play,addrl,result,dataout, U7模块由P/R模块的输出信号来选择输出。 3.3 系统实现 工作时序如下: 录音:PD低电平,P/R低电平,CE低电平,开始录音,CE变高电平,录音停止。放音:PD低电平,P/R变高电平,给CE一个由高到低的脉冲,开始放音,到第一个EOM处放音停止。放音时,若给CE低电平,则芯片持续放音,直到芯片存储空间末尾。如图2所示(图2为经综合后的时序仿真结果)。 3.4 FPGA的实现 本设计选用XILINX公司FPGA产品S05XLPG84。整个设计采用Verilog HDL语言描述,在XILINXFOUNDATION 3.0平台上完成了系统的仿真、综合、映射、布局。在后仿真结果正确后,通过器件编程(即通过编程电缆将设计下载到实际芯片中)进行系统调试,直至最后实现。 在实践过程中,我们还设计了译码器,将地址码译成LED码,从而通过三个LED显示地址位。可见,实际应用中还可以根据实际需要做进一步的设计开发,满足复杂操作或实时系统应用的要求。 4 结束语 以上便是此次小编带来的“芯片设计”相关内容,通过本文,希望大家对语音芯片设计具备一定的认知。如果你喜欢本文,不妨持续关注我们网站哦,小编将于后期带来更多精彩内容。最后,十分感谢大家的阅读,have a nice day!

    时间:2020-03-13 关键词: 芯片设计 语音芯片 isd 指数

发布文章

技术子站

更多

项目外包

更多

推荐博客