Tagged

LLAMA

A collection of 39 posts

TTS:MaskGCT & OuteTTS
MODEL-ZOO

TTS:MaskGCT & OuteTTS

在过去的一年中,seamless_communication、StyleTTS、VITS、DeepSpeech和Whisper 等项目都在 TTS(文本转语音)技术的进步中发挥了重要作用。但现在,回顾 GitHub,这些项目中的很多都已经沉寂了。 最初,我只对它们的功能有基本的了解,而没有深入研究它们背后的技术概念和机制。这次,受到最近发布的 MaskGCT 和 OutTTS 等开源项目的启发,我决定总结一下 TTS 的基础技术。总体而言,音频生成的质量自去年以来有了显着提高。以前,合成的声音听起来很机械;现在,多亏了 Hertz-dev 等模型,我们可以生成听起来更自然、更像人类的音频。 1、TTS 基础知识TTS 系统的主要目标是将输入的文本转换为听起来自然的语音。 1.1 传统TTS模型传统的 TTS 模型(例如 Tacotron 和 WaveNet)通常涉及三个主要步骤:

药物副作用问答系统
APPLICATION

药物副作用问答系统

虽然大多数人关注的是检索增强生成 (RAG) 对非结构化文本(例如公司文档或文件)的检索,但我对检索系统对结构化信息(尤其是知识图谱)的检索非常看好。GraphRAG 引起了很多关注,尤其是微软的实现。然而,在他们的实现中,输入数据是文档形式的非结构化文本,使用大型语言模型 (LLM) 将其转换为知识图谱。 在这篇博文中,我们将展示如何在包含来自 FDA 不良事件报告系统 (FAERS) 的结构化信息的知识图谱上实现检索器,该系统提供有关药物不良事件的信息。如果你曾经摆弄过知识图谱和检索,你的第一个想法可能是使用 LLM 生成数据库查询,以从知识图谱中检索相关信息来回答给定的问题。然而,使用 LLM 生成数据库查询仍在发展中,可能还不能提供最一致或最强大的解决方案。那么,目前有哪些可行的替代方案呢? 我认为,目前最好的解决方案是动态查询生成。这种方法不是完全依赖 LLM 来生成完整的查询,而是采用逻辑层,从预定义的输入参数确定性地生成数据库查询。可以使用具有函数调用支持的 LLM 来实现此解决方案。使用函数调用功能的优势在于能够向 LLM 定义它应该如何准备函数的结构化输入。这种方法确保查询生成过程是可控且一致的,

创业点子发生器
APPLICATION

创业点子发生器

创作者通常首先要努力的事情就是为他们的服务找到合适的利基创意。最好的方法始终是先找到一个微型 SaaS,它是 SaaS 的一个子集,专注于解决特定问题的小规模、高度专业化的应用程序。 但是你如何发现这些利基创意呢?为什么不让AI为你做这件事呢。在这个实验中,我整理了一个实用的应用程序,它可以帮助挖掘 Reddit、搜索引擎以找到利基创意。 在这篇博文中,我将分享如何构建这个 CrewAI 应用程序,该应用程序利用它来为微型 SaaS 生成利基创意。我们将深入研究应用程序结构、技术堆栈,并提供构建应用程序的分步指南。到最后,你将全面了解如何启动自己的 CrewAI 代理。 1、应用程序结构首先,让我们看一下应用程序结构。下面是概述我们应用程序关键组件的图表: 技术堆栈概述为了构建此应用程序,我们将使用各种工具和技术: Groq:用于服务大型语言模型 (LLM)。8B Llama3 模型:用于生成想法的核心模型。CrewAI:与 LangChain 工具一起使用,用于管理多个代理。Praw:用于从 Reddit

Farmer.chat:农业聊天机器人
APPLICATION

Farmer.chat:农业聊天机器人

全球约有 5 亿小农户:他们在全球粮食安全中发挥着关键作用。及时获取准确信息对于这些农民做出明智决策和提高产量至关重要。 “农业推广服务”为农民提供农业技术建议,并为他们提供必要的投入和服务以支持他们的农业生产。 仅在印度就有 30 万名农业推广人员,他们提供有关改进农业实践的必要信息,并帮助小农户做出决策。 但是,尽管推广人员的数量令人印象深刻,但数量不足以满足所有需求:他们与农民的互动比例通常为 1:1000。通过伙伴关系和技术接触农业推广人员和农民仍然是关键。 进入 GAIA 项目,这是一项由 CGIAR 率先发起的合作计划。 它通过专家支持计划将 Hugging Face 作为导师,并将 Digital Green 作为项目合作伙伴聚集在一起。 GAIA 有一个崇高的目标,那就是将多年的农业知识以研究论文的形式带到农民手中,这些研究论文在 GARDIAN 门户网站上精心维护。有近 46000 篇研究论文和报告,涵盖了数十年来全球不同作物的农业知识。 Digital Green 立即看到了开发由检索增强生成 (RAG) 驱动的智能聊天机器人的潜力,这些聊天机器人基于经过批准的精选信息。