大语言模型 - 主题 - twt企业IT交流平台

大语言模型

大语言模型(趋势联盟课题方向)

大语言模型（LLM）是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。

439 会员关注

227 会员贡献

101 关系主题

热点

热点

大语言模型·2024-02-19

一文读懂 NLM（神经语言模型）

Luga Lee · None　擅长领域：云计算, 容器, 容器云

46 会员关注

随着技术的不断发展，神经语言模型（NeuralLanguageModels，NLM）在自然语言处理（NLP）领域扮演着越来越重要且强大的角色。NLM利用神经网络来学习和表示语言的概率分布，从而能够更加精确地理解、处理和生成自然语言。这一技术的出现和发展为NLP领域带来了巨大的进步和潜力。NLM（神经...(more)

浏览867

评论4

银行银行AI大模型·2023-12-29

大模型在信用评估、欺诈检测、客户服务中的微调策略共同点与不同点？

国金证券AI算法工程师 · 国金证券　擅长领域：大语言模型, 人工智能, 数据库

在信用评估、欺诈检测和客户服务中，大模型的微调策略存在以下共同点和不同点：共同点：数据处理和微调：这三个领域都需要对数据进行有效的清理和处理，以确保训练出高质量的模型。不同点：学习方式不同：信用评估和欺诈检测通常采用监督学习方式，而客户服务则更倾向于使用无监督学习方...

浏览1310

软件开发MySQL·2024-03-04

MySQL写到Redis读的过程是实时还是异步？

匿名用户

实时的。前端能实时读到写入redis的数据。

浏览2375

大模型应用·2023-12-27

大模型应用设计与实现指南

shaowenchen · 保密　擅长领域：大语言模型, 人工智能, 网络

1.直接使用大模型面临的问题输出不稳定性生成式AI的特点之一，输出结果的多样性。同样一个问题，问大模型多次，可能会得到不同的答案。这种输出的不确定性，在对话、创作场景下，会给用户带来惊喜。但在确定性要求比较高的场景下，大模型进入不了采纳阶段。数据新鲜度不够训练大模型...(more)

浏览1076

评论7

银行大语言模型·2024-01-15

拥抱大模型趋势下，传统金融企业IT基础架构关键角色应该提升哪些核心技能以及提升路径建议探讨？

国金证券AI算法工程师 · 国金证券　擅长领域：大语言模型, 人工智能, 数据库

在拥抱大模型趋势下，传统金融企业IT基础架构关键角色应该提升以下核心技能：（1）深度学习和大数据技术：随着大模型的发展，对深度学习和大数据技术的需求日益增加。关键角色需要具备深度学习模型的理解和应用能力，以及大规模数据处理和分析的经验。（2）安全和隐私保护：金融领域涉及大量...

浏览1835

银行大语言模型·2024-01-15

大语言模型训练过程中，如何提供稳定训练断点保存和恢复的存储能力？

课题专家组

· M　擅长领域：云计算, 存储, 虚拟化

430 会员关注

要提供稳定训练断点保存和恢复的存储能力，可以考虑以下几点：使用持久化存储：在训练大语言模型时，应使用持久化存储来保存模型的状态和参数。这样，即使在训练过程中出现中断，也可以从保存的状态和参数中恢复训练，而不是从头开始。定期保存模型状态：在训练过程中，可以设置一定的周...

浏览1569

银行大模型·2024-01-10

国有大行及股份制银行有没有必要自研大模型？

联盟成员

· 某银行　擅长领域：人工智能, 大语言模型, 大数据

自研大模型的成本投入是巨大的，包括但不限于计算资源、人力资源、研发时间等。因此，大型银行在考虑自研大模型时，需要权衡成本与收益，确保投入能够带来足够的收益。其次，大型银行在数据资源方面具有天然优势，因为它们拥有庞大的客户群体和丰富的业务数据。这些数据可以用于训练...

浏览2922

银行大语言模型·2024-01-15

如何快速加载大模型需要的数据并进行训练？

课题专家组

· 某银行　擅长领域：服务器, 存储, 数据库

54 会员关注

1、使用GPU进行并行计算,利用GPU多核优势加速矩阵操作,大幅提升训练速度。2、开启数据并行训练,利用多张GPU通过数据切分方式进行模型训练,实现几何级别的加速。3、使用分布式训练框架如Horovod、Tensorflow 分布式等,支持多个服务器多个GPU并行训练,线性地缩短训练时间...

浏览1648

银行大语言模型·2024-01-10

当金融行业选择训推一体化架构建设大模型时，需要提前考虑那些方面的因素，通过那些方面进行可行性分析？

朱祥磊 · 某移动公司　擅长领域：大语言模型, 人工智能, 云计算

98 会员关注

需要提前考虑以下因素进行可行性分析：1. 数据质量与安全性：金融行业对数据质量和安全性有很高的要求。在选择训推一体化架构时，需要评估数据清洗、去重、脱敏和加密等方面的需求，确保数据完整、准确和安全。2. 技术选型与实现：根据业务需求和资源限制，评...

浏览1426

银行大语言模型·2024-01-10

金融行业建设大模型推理集群和训练集群时，如何选择合适的存储提升大模型的整体性能？

没电的手机

联盟成员

· 某金融企业　擅长领域：人工智能, 大语言模型, 云计算

核心是选择性价比高的，存储性能好的，保密性和稳定性兼顾的分布式文件系统（如Hadoop HDFS、Lustre等）或基于对象存储的文件系统（如Ceph）都是一些优秀的文件系统选泽物理磁盘存储介质：当前固态盘的存储介质具有更低的访问延迟和更高的读写速度，价格也相对适中，可选择金士顿，华为等厂...

浏览1525

描述

大语言模型（LLM）是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。

439 会员关注

227 会员贡献

101 关系主题

趋势联盟联盟课题方向

AI篇-大模型时代

计算篇-信创操作系统

数据库篇-数据库自主可控

存储篇-非结构化数据治理

云篇-关键业务入云

运维篇-自动化运维

相关企业云社区

NVIDIA英伟达

主题声望 24

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广

关注主题439