云原生的开源 AI 大模型基础设施预约报名-Rust 中文社区活动-活动行

活动内容收起 展开

活动简介：

加入我们，参加一场令人激动的 Open Source AI 见面会，聚集了领域内五位顶尖专家！我们的演讲嘉宾将进行有关他们的开源平台——Milvus、WasmEdge、FATE、商汤模型量化框架 PPQ 和智源——如何帮助开发者训练、构建、部署和协作人工智能项目的技术分享。

议程

下午1:30 - 1:35：介绍

下午1:35 - 2:20：使用 Rust 和 Wasm 开发轻量级 AI 应用 -- Michael Yuan，WasmEdge 创始人

下午2:20 - 3:05：FATE-LLM: 当联邦学习遇到大型语言模型 -- 王方驰，VMware CTO办公室高级工程师，FATE项目maintainer

下午3:05 - 3:50：向量数据库：大模型的长期记忆体 -- 李晨 Zilliz 运营及生态负责人

下午3:50 - 4:05：茶歇

下午4:05 - 4:50：在 AI 开发中模型量化相关的技术实践 -- 张志，商汤模型量化框架PPQ工程师

下午4:50 - 5:35：FlagEval：大模型评测开源项目 -- 玄日成，智源智能评测组算法研究员，天秤项目core contributor

下午5:35 - 6:00：集体照片和自由交流

具体议题介绍

演讲1：使用 Rust 和 Wasm 开发轻量级 AI 应用

LLMs如ChatGPT类似于没有记忆、感官或手部的大脑。API和插件使开发人员能够为LLMs添加这些关键功能，并启用LLM应用程序。OpenAI插件和函数模板的普及表明了对此类服务的巨大需求。

然而，当前的LLM插件通常建立在复杂的云本地基础设施之上，这些基础设施旨在为完整的服务（如VM，Linux容器和k8s集群）提供支持。这些基础设施对于大多数作为LLMs和外部服务之间轻量级链接的插件/无服务器应用程序来说过于繁重。Wasm已成为一种引人注目的轻量级、便携式和安全的运行时，适用于此类函数。

在这个演讲中，我们将讨论WasmEdge社区（一个CNCF沙盒项目）如何利用和构建了Wasm容器基础架构，用于LLM插件。我们将涵盖主要的用例和采用情况，例如研发管理、DevRel、市场营销自动化和培训/学习。然后，我们将深入探讨技术堆栈，以及社区创建的Rust和JavaScript SDK，这些都能实现这些LLM用例。

演讲2：FATE-LLM: 当联邦学习遇到大型语言模型

近年来，基于 transformer 的大型语言模型越来越受欢迎，各界讨论不断升温，各路大模型也相继发布，另一方面，大型语言模型在数据和隐私问题上面临的挑战也逐渐凸显。近期，开源联邦学习框架FATE发布了联邦大模型方案FATE-LLM，将联邦学习和大模型技术相结合，为以上问题带来前瞻性的解决方案。通过FATE-LLM，各参与方可以在数据不出本地域的前提下，用各自隐私数据共同进行大模型微调并互惠互利。本次演讲将介绍FATE-LLM在将联邦学习应用于ChatGLM、 LLaMA 等大型语言模型方面的最新努力，并探讨技术和实践上的挑战、设计思路以及未来规划。

听众受益： 1. 了解联邦学习与联邦大模型 2. 了解FATE-LLM相关设计思路 3. 了解FATE开源社区生态

演讲3：向量数据库：大模型的长期记忆体

对于构建专有大型语言模型的组织而言，向量数据库至关重要。向量数据库的一个新型重要用例是 LLM，在文本生成过程中可用于检索领域特定事实或专有事实，用以存储、索引、搜索和检索非结构化数据的大型数据集。本次分享将重点介绍AI 基础设施的开源向量数据库 Milvus 以及对应的云服务 Zilliz Cloud 是如何知识增强和赋能 LLM，并进而引出大模型与向量数据库的关系、生态集成、工具与应用等。

听众收益：

1. 了解大模型和向量数据库的集成构建AI Native应用

2. 向量数据库如何知识增强和赋能 AIGC 领域相关

演讲4： AI 开发中模型量化相关的技术实践

神经网络量化是一种广泛应用的技术，可以在较低的成本下降低神经网络的计算代价和内存使用。目前使用最为广泛的量化技术将浮点模型转换为8位整数模型，并使用整数运算器完成网络的推理过程。量化技术目前正广泛应用于推理框架当中，大模型的压缩与部署也广泛地依赖于神经网络量化压缩，由商汤 OpenPPL 团队开发的量化框架 PPQ 是目前国内神经网络量化框架的佼佼者，其支持多个硬件后端平台的量化模拟与部署，并在此基础上抽象出一套完整的量化框架设计。我们将着重讲解大语言模型中广泛应用的量化技术，从weight only量化到groupwise kv cache量化，介绍这些技术的应用场景与性能收益。

听众收益：

您可了解到如何在服务器上进行网络部署以及性能调优，进而大幅降低神经网络模型的存储需求和计算成本，从而使得这些模型可以在资源要求严苛的设备上运行。通过一些在实际应用中的案例，您将更进一步地了解神经网络模型量化的实现细节与局限性。

演讲5：FlagEval：大模型评测开源项目

模型评测是模型生产生命周期中非常重要的一环，随着近年来基础模型相关理论和技术的高速发展，但传统的评测方法和基准在基础模型评测上正面临失效的困境，因此研发面向基础模型的评测方法和工具就显得更为重要。FlagEval 大模型开源评测体系创新构建了“能力-任务-指标”三维大语言模型评测框架，尝试细粒度的刻画基础模型的认知能力边界。

Check out my channel for in-depth tech eviews! (3).png

举报活动

活动标签

IT互联网

报名须知

1、本活动具体服务及内容由主办方【Rust 中文社区】提供，活动行仅提供票务技术支持，请仔细阅读活动内容后参与。

2、如在活动参与过程中遇到问题或纠纷，双方应友好协商沟通，也可联络活动行进行协助。

您还可能感兴趣

您有任何问题，在这里提问！

为营造良好网络环境，评价信息将在审核通过后显示，请规范用语。

全部讨论

Stephen Curry 1年前顶0

有线上直播吗？

来自：
- 夏歌 1年前
  
  Reply@Stephen Curry：关注 Second_State, 讲师的演讲视频将在近期放出。
DL铛铛狗 1年前顶0

请问有线上的链接吗

来自：
- 夏歌 1年前
  
  Reply@DL铛铛狗：关注 Second_State, 讲师的演讲视频将在近期放出。
leng 1年前顶0

请问有线上直播吗？

来自：
- 夏歌 1年前
  
  Reply@leng：关注 Second_State, 讲师的演讲视频将在近期放出。

热门站点

精选推荐

更多服务

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起 展开

活动标签

最近参与

报名须知

您还可能感兴趣

凝心聚力，砥砺前行——2024海立大楼中介答谢会

从巴黎可以散步到上海——田嘉伟×金雯×赵松×张茜茹对谈《今晚出门散心去》新书分享

2024年度农业科技企业专精特新企业专题培育活动

低空经济产业交流会

信息茧房时代跨越立场的真正交流能否实现？——林垚 x 贾敏《空谈》新书分享

Sales面对面商机分享·技能提升·人脉拓展

.NET Conf China 2024｜智能·创新·开放

（议程更新）数智赋能绿色低碳---2024长三角绿色转型发展论坛

您有任何问题，在这里提问！

全部讨论

Stephen Curry 1年前顶0

有线上直播吗？

夏歌 1年前

DL铛铛狗 1年前顶0

请问有线上的链接吗

夏歌 1年前

leng 1年前顶0

请问有线上直播吗？

夏歌 1年前

活动主办方更多

Rust 中文社区

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起展开

活动标签

最近参与

报名须知

您还可能感兴趣

凝心聚力，砥砺前行——2024海立大楼中介答谢会

从巴黎可以散步到上海——田嘉伟×金雯×赵松×张茜茹 对谈《今晚出门散心去》新书分享

2024年度农业科技企业 专精特新企业专题培育活动

低空经济产业交流会

信息茧房时代 跨越立场的真正交流能否实现？——林垚 x 贾敏《空谈》新书分享

Sales面对面 商机分享·技能提升·人脉拓展

.NET Conf China 2024｜智能·创新·开放

（议程更新）数智赋能 绿色低碳---2024长三角绿色转型发展论坛

您有任何问题，在这里提问！

全部讨论

Stephen Curry 1年前 顶0 有线上直播吗？

夏歌 1年前

DL铛铛狗 1年前 顶0 请问有线上的链接吗

夏歌 1年前

leng 1年前 顶0 请问有线上直播吗？

夏歌 1年前

活动主办方更多

Rust 中文社区

使用第三方账号登录

使用手机号/邮箱登录

举报

让批评和口水来的更猛烈些吧！

从巴黎可以散步到上海——田嘉伟×金雯×赵松×张茜茹对谈《今晚出门散心去》新书分享

2024年度农业科技企业专精特新企业专题培育活动

信息茧房时代跨越立场的真正交流能否实现？——林垚 x 贾敏《空谈》新书分享

Sales面对面商机分享·技能提升·人脉拓展

（议程更新）数智赋能绿色低碳---2024长三角绿色转型发展论坛

Stephen Curry 1年前顶0

有线上直播吗？

DL铛铛狗 1年前顶0

请问有线上的链接吗

leng 1年前顶0

请问有线上直播吗？