Agentic AI基础设施实践经验系列(六):Agent质量评估

2025年11月11日
阅读 22 分钟
640
Agent 评估是指对 Agent 在执行任务、决策制定和用户交互方面的性能进行评估和理解的过程。由于 Agent 具有固有的自主性,对其进行评估对于确保其正常运行至关重要。

Agentic AI基础设施实践经验系列(五):Agent应用系统中的身份认证与授权管理

2025年11月10日
阅读 13 分钟
764
人工智能正经历深刻变革。传统AI多为被动工具,而随着大型语言模型(LLM)和多智能体系统(MAS)的快速发展,AI Agent正向具有高度自主性的主动智能体(Agentic AI)演进。这些AI Agents能够自主思考、规划和执行复杂任务,甚至协同完成更复杂的目标。

Agentic AI基础设施实践经验系列(四):MCP服务器从本地到云端的部署演进

2025年11月07日
阅读 11 分钟
765
随着人工智能技术的快速发展,特别是大语言模型(LLM)的广泛应用,Agentic AI(智能体AI)正在成为下一个技术热点。在 Agentic AI 的工作流程中,AI 智能体需要调用各种外部工具来扩展其能力边界——从数据库查询到 API 调用,从文件操作到复杂的业务逻辑处理。

Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践

2025年11月06日
阅读 10 分钟
988
本文将深入探讨 Agent应用中的记忆需求、记忆类型、技术组件和主流开源框架,并介绍基于亚马逊云科技的数据产品自行构建记忆模块,以及基于Agent构建平台Bedrock AgentCore的Agent memory的托管方案。

Agentic AI基础设施实践经验系列(二):专用沙盒环境的必要性与实践方案

2025年11月04日
阅读 10 分钟
728
Agent应用作为新一代人工智能应用形态,能够自主理解用户意图、制定执行计划并调用各种工具完成复杂任务,正在重塑我们与AI系统的交互方式。这类智能代理不仅能够处理自然语言对话,更能够主动执行代码、操作应用程序、分析数据,真正实现从"对话式AI"向"行动式AI"的跃升。

Agentic AI基础设施实践经验系列(一):Agent应用开发与落地实践思考

2025年11月03日
阅读 11 分钟
834
在过去的短短几年内,基础模型(FMs)已经从直接用于响应用户提示创建内容,发展到现在为AI Agent提供动力。AI Agent是一类新型软件应用,它们使用基础模型来推理、规划、行动、学习和适应,以追求用户定义的任务目标,同时只需要有限的人工监督。AI Agent由基础模型驱动,其不确定性和非预定义逻辑的运行机制,为开发者带...

使用智能代理在亚马逊云科技无服务器架构上进行源代码分析

2025年10月31日
阅读 8 分钟
592
随着软件开发规模的不断扩大和代码复杂性的增加,传统的代码分析方法已经无法满足现代开发团队的需求。本文探讨了如何利用生成式人工智能代理(GenAI Agent)结合亚马逊云科技无服务器架构来构建高效、可扩展的源代码分析平台。我们通过多个基于生成式AI智能体的代码分析项目实施案例总结了在亚马逊云环境中部署智能代码...

基于Strands Agent框架的考题生成及Agent 效果评估

2025年10月30日
阅读 21 分钟
498
在教育领域,考试(一年级-高三年级,数学/科学/英语/历史等多学科)作为评估学生学习成果的核心手段,其传统生成方式长期存在诸多痛点:时间成本高昂、质量稳定性不足、题型覆盖局限、迭代效率低下等问题。为解决这些问题,我们开发了基于 Strands Agent 框架的 AI 考试生成项目。该项目依托大语言模型的强大能力实现考...

构建AI驱动的智能定价解决方案:新能源充电运营的数字化转型实践

2025年10月28日
阅读 4 分钟
610
随着全球电动汽车市场的快速发展,充电基础设施运营商面临着日益复杂的定价挑战。传统的静态定价模式已无法适应多变的市场环境、竞争格局和用户需求。本文将深入探讨如何构建Agentic AI驱动的智能报价系统,帮助充电运营商(CPO)实现动态定价优化,提升运营效率和盈利能力。

通过简单的代码,快速完成数据分析智能体方案的构建

2025年10月27日
阅读 16 分钟
532
在电商和游戏等数据密集型行业中,业务人员经常需要快速获取数据洞察及时应对运营策略的变化,例如转化率,下单率,付费玩家的等级分布变化等等问题。这些问题往往需要涉及复杂的SQL查询。传统方式主要依赖技术人员手动的查询语句,或者使用固定报表,整体灵活性较差。非技术人员希望可以通过自然语言完成数库查询的工作...

基于Amazon Bedrock的TwelveLabs Marengo Embed 2.7多模态搜索系统

2025年10月24日
阅读 14 分钟
672
本文展示如何通过AI辅助开发,在零手工编码的情况下构建生产就绪的多模态搜索应用,完整体验Amazon Bedrock上TwelveLabs Marengo Embed 2.7模型的跨模态AI能力。

利用 CloudWatch AIOps 实现智能化根因分析与故障排查

2025年10月23日
阅读 30 分钟
671
在当今复杂的云环境中,运维团队面临着前所未有的挑战。随着微服务架构、容器化应用和无服务器计算的普及,系统组件之间的依赖关系变得越来越复杂,故障排查的难度也随之增加。当生产环境出现问题时,运维人员通常需要在海量的日志、指标和事件中寻找故障的根本原因,这不仅耗时耗力,还可能导致业务中断时间延长,造成...

GenDev 智能开发:Amazon Q Developer CLI 赋能Amazon Code Family实现代码审核

2025年10月21日
阅读 19 分钟
548
代码质量保障是现代软件工程中不可或缺的重要组成部分,而代码审核作为质量控制的核心手段,直接影响着软件产品的稳定性和可维护性。长期以来,企业普遍采用人工代码审核模式,主要由经验丰富的开发工程师对代码变更进行逐一检查和评估。但是人工审核不仅消耗大量人力资源和时间成本,并且由于审核人员的技术背景和经验...

Amazon Bedrock AgentCore Memory:亚马逊云科技的托管记忆解决方案

2025年10月20日
阅读 18 分钟
525
亚马逊云科技提供开箱即用的托管服务,通过AI Agent构建平台Bedrock AgentCore中的记忆模块帮助开发者更快捷地为AI Agent赋能记忆功能。

Amazon Generative AI Use Cases:"开箱即用的企业级生成式AI应用平台"

2025年10月16日
阅读 8 分钟
785
从零开始构建企业级生成式AI应用面临诸多技术挑战:模型选择与集成复杂、安全合规要求严格、开发周期长、维护成本高。AI应用开发需要深厚的机器学习背景、复杂的基础设施搭建,以及大量的前端开发工作。

亚马逊云科技 WAF 指南(十)用 Amazon Q Developer CLI 解决 DDoS 防护与 SEO 冲突问题

2025年10月14日
阅读 5 分钟
575
亚马逊云科技于 2025 年 6 月推出了全自动化的 WAF AntiDDoS 托管规则组。相比于 Amazon Shield Advanced,它提供更快速的秒级检测与缓解,以及更高精准度和更灵活的配置。其中 ChallengeAllDuringEvent 规则会在攻击事件发生时,对所有请求(除了预先定义的 Challenge URI 例外路径)进行 JavaScript Challenge(软性缓...

使用大模型技术构建机票分销领域人工智能客服助手

2025年10月10日
阅读 8 分钟
1.3k
在机票分销领域,大型票务代理是供应链的中转枢纽,他们上游对接各大航空公司,下游对接各中小型票务代理、OTA(Online Travel Agency在线旅行社)或者旅行社等。大型票务代理通常会部署虚拟客服系统,来应对其下游生态圈企业的机票查询、预定和退改签等咨询业务。然而由于传统虚拟客服在技术上的局限性,用户经常遭遇"...

Strands Agents SDK 助力翰德 Hudson 实现智能招聘新突破

2025年09月10日
阅读 7 分钟
2k
在 AI 人才争夺日益白热化的今天,传统招聘模式面临着效率低下、精准度不高、难以应对海量候选人等挑战,急需一种创新的智能招聘解决方案来提升招聘效能。翰德 Hudson 作为全球人力资源服务领域的领军企业,一直将科技创新视为发展的引擎,并持续探索招聘效率优化的前沿解决方案。此前,翰德 Hudson 与亚马逊云科技合作...

基于 CoT 协调多 MCP Tool — 智能运维 Redshift

2025年09月04日
阅读 9 分钟
1.3k
Amazon Redshift 是一种在云端运行的全托管、PB 级数据仓库服务。它为企业提供了强大的数据分析能力,能够处理海量数据并提供快速的查询性能。作为亚马逊云科技数据分析生态系统的核心组件,Amazon Redshift 通过列式存储、并行处理和高效的数据压缩算法,使组织能够以经济实惠的方式从其数据中获取洞察。

基于 Amazon Q Developer+Remote MCP 访问 Amazon Redshift

2025年09月02日
阅读 10 分钟
1.8k
Amazon Q Developer 是亚马逊云科技推出的一款生成式 AI 助手,加速整个软件开发生命周期的构建,从设计、开发、测试和运维,到执行软件升级。同时,它也是亚马逊云科技上的专家,可在亚马逊云科技管理控制台中帮助您优化云成本和资源、提供架构最佳实践指导、调查运营事件以及诊断和解决网络问题。

借助 Transcribe/Polly 打造新一代智能语音客服,实现媲美人工客服的对话体验

2025年08月28日
阅读 21 分钟
947
在快时尚电商行业智能化生态系统的演进历程中,随着文本驱动智能体在逻辑推理和任务执行层面的日趋成熟,进一步提升交互体验的关键突破口正转向更加拟人化的语音到语音(S2S)解决方案。这一技术演进的核心目标是根本性改变传统语音交互中机械化应答所带给客户的负面感受,为用户打造更自然、更富有情感共鸣的智能对话体...

Amazon Q Developer CLI + 飞书——打造对话式的 AI Agent 智能运维平台

2025年08月26日
阅读 13 分钟
1.1k
在现代云原生架构中,越来越多的组织采用微服务模式,系统由多个团队共同维护。为了隔离权限和业务板块,不少组织会管理数十个亚马逊云科技账号。当出现问题时,传统的响应方式往往是逐一联系相关负责人进行排查,导致沟通链条冗长、协作效率低下,甚至可能错失最佳处理时机。这种"拉人战术"不仅消耗大量时间,还会导致...

在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题

2025年08月21日
阅读 23 分钟
1.2k
大语言模型(LLM)在自然语言处理、任务自动化和智能决策等领域展现了非凡的潜力。然而,其有限的上下文窗口常常成为复杂任务的瓶颈。特别是在需要调用大量外部工具时,例如通过模型上下文协议(MCP)管理的工具,将所有工具描述嵌入提示词会导致"提示词膨胀"(Prompt Bloat)。这不仅挤占了宝贵的上下文空间,限制模型...

RAG-MCP 性能剖析:在 Amazon Bedrock 中多维度测试提示词优化的效果

2025年08月19日
阅读 11 分钟
1.5k
大语言模型(LLM)在处理工具调用场景时常面临"提示词膨胀"问题,特别是当需要在上下文中包含大量工具描述时。这不仅增加了 API 调用成本,还可能导致模型性能下降。RAG-MCP(基于检索增强生成的多通道原则)框架提出了一种优化方案,通过语义检索筛选相关工具,显著减轻提示词负担。本文将基于测试结果严格的实验方法,...

Amazon Q Developer 结合 MCP 实现智能化云成本分析

2025年08月14日
阅读 4 分钟
1.2k
随着企业数字化转型的深入推进,Amazon 云服务的使用规模和复杂度急剧增长,成本管理面临前所未有的挑战。企业需要处理包含数百个 Amazon 服务、数千个计费维度的海量 CUR 数据,而现有工具在实际使用中存在以下局限性:

通过自动化工具实现亚马逊云上资源标签管理

2025年08月12日
阅读 19 分钟
1.2k
在云计算日新月异的时代,企业对亚马逊云科技资源的使用正在呈现指数级增长。从最初的几十个资源扩展到数百甚至上万个,有效管理这些云资源已成为企业 IT 运营中的关键挑战。亚马逊云科技资源标签(Tags)作为一种元数据机制,已发展成为现代云资源管理策略的基石。

基于 Amazon Q Developer CLI 进行智能混沌工程实验

2025年08月07日
阅读 5 分钟
2.1k
混沌工程 Chaos Engineering 是在大规模分布式系统上进行受控实验,观察系统行为并发现系统弱点,以建立应对意外风险引发混乱的能力和信心。

零代码生成 3D 游戏:基于 Amazon Q Developer CLI 和 Three.js 的实践

2025年08月05日
阅读 8 分钟
1.1k
Amazon Q Developer 是一个由生成式人工智能(AI)驱动的对话助手,可帮助你理解、构建、扩展和运维亚马逊云科技应用程序。你可以向它询问关于亚马逊云科技架构、你的亚马逊云科技资源、最佳实践、官方文档、技术支持等问题。Amazon Q 不断更新其能力,确保为你的问题提供最具上下文相关性和可操作性的答案。

基于 Amazon Nova 实现优化呼叫中心导航场景

2025年07月31日
阅读 8 分钟
971
在传统呼叫中心场景中,基于按键导航是一种经典的用户交互方式。然而,随着导航场景的增加、分类的扩展以及层级的增多,按键流程设计变得越来越复杂,用户体验也因此受到影响。为了提供更加流畅的用户体验,半开放式语音导航应运而生。在这种模式下,终端用户只需说出相应的关键词,即可获得下一步指引。

从 Invoke Model API 迁移到 Converse API,简化生成式 AI 应用开发

2025年07月29日
阅读 6 分钟
1k
Amazon Bedrock Runtime API 集成指南——从 Invoke Model API 迁移到 Converse API,简化生成式 AI 应用开发

AltStyle によって変換されたページ (->オリジナル) /