当前位置:首页 > 工业控制 > 电路设计项目集锦
[导读]在之前的教程中,我介绍了如何通过REST将ESP32连接到谷歌Gemini API以发送音频文件并对其进行转录。在本教程中,我将扩展到实际使用录制的音频而不是转录它-在这种情况下,打开和关闭LED环,加上根据语音命令改变LED的颜色。虽然我只是在操纵一个LED环,但你可以用这里使用的技术(称为函数调用)做任何事情,从控制电机到对在线服务提出额外请求。

我们在建造什么?

在之前的教程中,我介绍了如何通过REST将ESP32连接到谷歌Gemini API以发送音频文件并对其进行转录。在本教程中,我将扩展到实际使用录制的音频而不是转录它-在这种情况下,打开和关闭LED环,加上根据语音命令改变LED的颜色。虽然我只是在操纵一个LED环,但你可以用这里使用的技术(称为函数调用)做任何事情,从控制电机到对在线服务提出额外请求。

在之前的教程中,我使用这些连接设置了一个设备:

现在唯一的区别是,我从Adafruit添加了一个24新像素的环,电源线在相同的3.3v轨道上,GND到GND,数据线在ESP32引脚D15上。

为了简单起见,这也是上一篇教程结束时使用的代码,您可以将其作为本演练的起点。

什么是函数调用?

很好,在我们深入了解新内容之前,让我们先谈谈函数调用。本质上,这是一种告诉Gemini API你在程序中有一些自定义函数定义的方法然后Gemini可以根据用户的输入/请求决定调用其中的任何一个。您可以通过向POST到API的JSON中添加新属性来实现这一点。这是这个灯的例子中JSON的样子。

您可以在这里看到,您需要发送将要调用的函数的名称、函数的描述,以便Gemini API知道何时适合调用它,还可以选择发送一个属性列表,这些属性可以传递给函数,以便自定义它的工作方式。您还可以要求在调用函数时发送这些属性。

新代码

好了,现在我们已经有了基本的概念,让我们更新音频录制代码来处理函数调用!让我们首先将Adafruit NeoPixel库添加到类的顶部,以及定义LED环使用的引脚,该环上有多少NeoPixels,以及LED使用的红/绿/蓝颜色的一些默认值。我们还需要定义neoppixel控制器对象。

进入setup()函数,我们只需要初始化pixels对象并将led设置为默认的关闭状态。

我们还将添加一个名为toggleLights(bool on)的新函数,用于在Gemini API触发时切换灯的打开或关闭。

现在我们可以进入函数调用的核心代码。进入createAudioJsonRequest()函数并将其替换为以下代码:

虽然看起来这里有很多事情要做,但它主要只是从SD卡读取音频数据,然后构建您可以在教程前面看到的JSON结构。

最后,我将transcribeAudio()函数重命名为sendAudio()。现在我们可以检查functionCall参数是否存在于响应中,而不是打印返回的音频文本,找出正在调用的函数,然后提取该函数的参数以对它们进行处理。在本例中,我正在检查toggleLights,它将包含一个布尔值,用于指示灯是否应该打开,并且我将该值传递给toggleLights()函数。除此之外,我正在监听Gemini API将“changeColor”作为一个functionCall值发回。如果成功了,我就从参数中提取红色、绿色和蓝色值并保存它们,然后用这些保存的值打开灯。你可以在这里看到整个函数:

此外,Gemini API可以理解多种语言的音频记录,而无需事先定义这些语言。例如,我用这段代码用西班牙语打开LED环,把颜色变成绿色(注意,我实际上不会说西班牙语,所以我用谷歌Translate和文本到语音的功能,但它工作得很好!)。

结论

这就是添加到音频记录示例中的内容,能够使用完整的句子来控制你的设备,对语音进行复杂的操作。我很想看到你们使用这些信息制作的非常酷的项目,所以请留下评论和它们的链接,我们将在以后的教程中再见!

本文编译自hackster.io

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭