2024年11月大数据月报
发布时间
阅读量:
阅读量

- 手把手系列丨如何使用Milvus Backup备份向量数据
- 大模型技术在淘宝生鲜审核场景的应用
- “亿”想天开AI|LLM在eBay推理平台的工程实践与应用
- Time Travel Queries|在 RisingWave 中访问历史数据
- 走进京东零售广告研发部:大模型时代下的新一代广告系统
- 智慧零售2.0:丰e足食新解法
- 多模态大语言模型领域进展分享
- 阿里重磅开源 Fluss: Flink Unified Streaming Storage
- Nebula Flink Connector 在实时 ETL 的实践
- 某省医保局集成Flink CDC YAML应用实践
- 实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
- 如何将 Postgres 变更数据实时传输到 Apache Iceberg
- 迈向主动智能:使用流式数据库构建事件驱动智能体
- 使用 RisingWave 轻松构建实时欺诈检测系统
- RisingWave 速查表(三)
- Prometheus在B端门店回收系统中的应用
- 性能提升 2000%!揭秘 MyBatis-Plus 批量插入的终极优化技巧
- 转转度量平台技术建设实践
- 空间换时间-将查询数据性能提升100倍的计数系统实践
- 接口从4秒到200毫秒-小小的日志竟能引发如此问题
- 多任务学习在转转主搜精排的应用
- 腾讯大数据基于StarRocks的向量检索的技术实现与实践分享
- RAG 关键技术及未来趋势发展
- Milvus 2.5:全文检索上线,标量过滤提速,易用性再突破!
- Milvus×Florence:一文读懂如何构建多任务视觉模型
- RAG搭建中,如何选择最合适的向量索引?
- 如何用大模型+向量数据库,帮你搞定出行规划与旅游blog
- 套娃嵌入:如何优化向量搜索成本,并兼顾延迟与召回
- 企业RAG构建中,如何用“行级别权限管控”避免数据泄露
- SentenceTransformers×Milvus:如何进行向量相似性搜索
- 深度解读混合专家模型(MoE):算法、演变与原理
- vLLM×Milvus:如何高效管理GPU内存,减少大模型幻觉
- 通义×Milvus:手把手教你打造专属AI技术顾问
- Neo4j×Milvus:手把手教你搭建GraphRAG Agent
- JinaCLIP×Milvus:手把手教你搭建多模态RAG系统
- 大语言模型鼻祖Transformer的模型架构和底层原理
- Late Chunking×Milvus:如何提高RAG准确率
- 新兴数据仓库设计与实践手册:从分层架构到实际应用(三)
- 新兴数据仓库设计与实践手册:从分层架构到实际应用(二)
- 新兴数据仓库设计与实践手册:从分层架构到实际应用(一)
- 从ETL到DataOps:WhaleStudio替代Informatica,实现信创化升级
- Whalestudio助力西南某商业银行数据中台建设 | 实践探索
- 精选 Top10 开源调度工具,解锁高效工作负载自动化
- 分布式锁的实现原理
- StarRocks存算分离在得物的降本增效实践
- 基于Redis内核的热key统计实现方案
- Java性能测试利器:JMH入门与实践
- 得物精准测试平台设计与实现
- Apache SeaTunnel 自定义连接器适配华为大数据平台集成组件ClickHouse
- 【全面解读】Apache SeaTunnel常见问题全攻略
- 高效处理日均5000亿+数据:58集团基于SeaTunnel的数据集成平台架构优化
- 解析 Apache SeaTunnel 的任务运行过程
- 全面解析 SeaTunnel API 源码:从入门到精通数据集成
- 10月回顾 | Apache SeaTunnel社区动态与进展一览
- 手把手入门 | 使用SeaTunnel从InfluxDB同步数据到Doris
- 抖音集团大数据血缘演进与深度应用
- 抖音集团也在用的数仓「降本」利器
- 抖音集团指标管理与消费体系建设实践
- 数据湖存储加速方案的发展和对比分析
- 从零开始了解推荐系统全貌
- 为什么说逻辑数据编织是一种低门槛、高容错度、高 ROI 的数据集成与开发模式?
- 释放数据生产力——数据编织的价值实现与评估
- 分布式读写锁的奥义:上古世代 ZooKeeper 的进击
- 开放表格式的历史和演变 - 第一部分
- 开放表格式的历史和演变 - 第二部分
- 2024 年 10 月 Apache Hudi 社区新闻
- 如何优化开放数据湖仓一体的性能
- 不同表格式如何表示规范文件集?
- 微软和麻省理工权威发布:Prompt格式显著影响LLM性能,JSON比Markdown准确性高42%
- Alluxio 在爱奇艺大数据的实践
- 爱奇艺基于多模态的台词说话人识别技术
- 性能指标提升50%+,携程数据报表平台查询效率治理实践
- 资源节省 81%,作业帮 MySQL千表入湖仓实践
- 传统NLP算法结合大模型私有化部署简易知识问答体系工程实践
- AI对话魔法|Prompt Engineering 探索指南
- 一文理解布隆过滤器和布谷鸟过滤器
- 数据科学在京东物流关键角色与前沿应用探索
- 基于图遍历的Flink任务画布模式下零代码开发实现方案
- Redis热点Key自动发现机制和客户端缓存方案
- 开源分析和落地方案—Sentinel篇
- 白话文讲解大模型| Attention is all you need
- StarRocks在Shopee数据产品的实践
- Cisco WebEx 数据平台基于 Apache Doris 统一 Trino、Pinot、Iceberg、Kyuubi技术栈
- 基于 Apache Doris 的一站式数据服务平台建设与实践
- 兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
- Apache Doris 2.1.7 版本正式发布
- 从 Elasticsearch 到 Apache Doris 统一搜索与分析引擎,腾讯音乐内容库升级实践
- 阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步
- 指标+AI+BI:构建数据分析新范式
- LangChain RAG&Agent实践-活动组件AI助手的实现
- Kubernetes 中 RBAC 权限在生产环境中的应用
- 维度爆炸背景下uv计算在Feed业务的高效实践
- 数据湖系列之四 | 数据湖存储加速方案的发展和对比分析
- 百度沧海·存储统一技术底座架构演进
- 计算不停歇,百度沧海数据湖存储加速方案 2.0 设计和实践
- 数据中台基于Apache SeaTunnel的应用探索与实践
- GraphRAG全局问答工程化实践
- 分布式跟踪之推断跨度技术初探
- 基于多重索引的去窗口化实时流关联技术
- PaaS for AI技术优化探索
- 数据驱动的MoE构建:一种通过单个LLM构建MoE的方法
- 大模型技术在淘宝生鲜审核场景的应用
- 全面解析:从AI原理到模型演进及代码实践
- 豆包 MarsCode 落地编程助手场景的探索实践
- 从 ETL 到 NoETL 的数据架构演进——Denodo 的创新解决方案
- 从大数据到大模型:现代应用的数据范式
- 滴滴ChatBI技术实践:智能数据分析的前沿探索与应用
- 谷歌科学家万字长文:《改变你职业生涯的一篇文章,我如何运用人工智能完成工作》建议每个人都要读一遍
- 火山引擎基于大模型 ChatBI 的演进与实践
- AI改变工作:一天内打造专属于你自己的RAG
- 京东数据架构解析:供应链效率提升与决策优化策略
- 蚂蚁集团、网商银行统一动态纠偏框架,非随机缺失问题优化新视角
- 大模型时代下的私有数据安全与利用
- 百度沧海·存储统一技术底座架构演进
- 抖音集团数据血缘深度应用:架构、指标与优化实践
- 腾讯语音合成技术:模型优化与推理加速实践
- 策略产品AI转型指南:能力模型与实战策略
- DataWorks:新一代 Data+AI 数据开发与数据治理平台演进
- RAG 2.0性能提升:优化索引与召回机制的策略与实践
- 深度|什么是李飞飞的AI“世界模型”,它们为什么重要?
- 智慧零售2.0:丰e足食新解法
- 火山引擎 ByteHouse:湖仓一体架构的创新与实践
- 滴滴指标标准化实践
- 京东电商搜索:大模型生成式检索优化实践
- 大模型在数据管理和应用领域的实践
- Agent+Copilot:大模型在智能运维领域的应用
- 快手大数据分析-NoETL 驱动下的功能实践
- 数据洪流中的智能航舵——Oceanus 流式湖仓探索,弹性降本方案
- B 站基于 Iceberg 的流批一体的探索和实践
- EasyRec 推荐算法训练推理优化
- AI驱动:构建高效数字员工的策略与实践案例
- 京东健康基于大模型的生成式推荐在电商标品推荐的应用
- 分布式Data Warebase技术解析与应用实践
- 替代 NL2SQL,Agent+业务语义的创新产品设计
- 超拟人大模型技术与情绪价值应用深度解析
- 货拉拉利用大模型打造多场景个人、办公助理实践
- DataOps for LLM 的数据工程技术架构实践
- 腾讯云助力出海企业高效构建全球大数据基础设施
- 数据性能突破:Spark SQL解析层优化技巧与实践
- 腾讯分析型 BI+AI 产品 OlaChat 创新探索
- NebulaGraph 的 GraphRAG 进展、实践
- ChatDBA: 数据库根因分析智能助手的实践与应用
- 一篇讲明白LLVM指令调度算法
- AIGC 在蚂蚁保保险领域的应用探索
- 腾讯大数据实时湖仓智能优化实践
- 百川智能:深度学习大模型推理性能优化策略
- 统一元数据管理 - Gravitino 在 B 站的最佳实践
- 大模型与行业融合:推动钢铁、医疗、教育领域的智能化变革
全部评论 (0)
还没有任何评论哟~
