欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
全部教程·
软件架构·
美团技术架构
[目录]
·
Hadoop集群服务器cpu sys态异常的定位与解决
Kafka 数据平台实践
美团技术实践
Log4j2日志导致线程Block的问题剖析
可视化全链路日志追踪实践
美团技术团队精选论文解读
美团CI/CD流水线引擎的建设实践
美团外卖广告大规模深度学习模型实践
大众点评搜索相关性技术探索与实践
CVPR2022 美团技术团队精选论文解读
美团目标检测框架
美团综合业务推荐系统的质量模型及实践
美团小样本学习训练实战
数据库全量SQL分析与审计系统性能优化
Android so体积优化的探索与实践
美团对话摘要技术实践
如何应对开源组件⻛险
端智能在大众点评搜索重排序的应用实践
美团图神经网络训练框架的实践和探索
CompletableFuture原理与实践-外卖商家端API的异步化
业务数据治理体系化思考与实践
2022年美团科研合作课题公开征集启动
数据库异常智能分析与诊断
标准化思想及组装式架构在后端BFF中的实践
美团外卖广告智能算力的探索与实践(二)
基于代价的慢查询优化建议
Linux下跨语言调用C++实践
短视频内容理解与生成技术在美团的创新实践
知识图谱可视化技术在美团的实践与探索
Linux中基于eBPF的恶意利用与检测机制
终端新玩法:“零代码”的剧本式引导
Twins:重新思考高效的视觉注意力模型设计
TensorFlow在美团外卖推荐场景的GPU训练优化实践
远程热部署在美团的落地实践
设计模式二三事
异构广告混排在美团到店业务的探索与实践
GPU在外卖场景精排模型预估中的应用实践
美团外卖广告平台化的探索与实践
数据治理一体化实践之体系化建模
美团集群调度系统的云原生实践
美团搜索中查询改写技术的探索与实践
从0到1:美团端侧CDN容灾解决方案
FlutterWeb性能优化探索与实践
TensorFlow在推荐系统中的分布式训练优化实践
细粒度情感分析在到餐场景中的应用
美团外卖终端容器无关化研发框架
预训练技术在美团到店搜索广告中的应用
Fairplay DRM与混淆实现的研究
美团跨端一体化富文本管理技术实践
美团搜索多业务商品排序探索与实践
美团知识图谱问答技术实践与探索
美团基于知识图谱的剧本杀标准化建设与应用
情感分析技术在美团的探索与应用
美团智能客服核心技术与实践
如何优雅地记录操作日志?
新一代CTR预测服务的GPU优化实践
美团商品知识图谱的构建及应用
美团外卖实时数仓建设实践
小样本学习及其在美团场景中的应用
Spock单元测试框架以及在美团优选的实践
美团App页面视图可测性改造实践
美团终端消息投递服务Pike的演进之路
本地生活综合性需求图谱的构建及应用
多业务建模在美团搜索排序中的实践
常识性概念图谱建设以及在美团场景中的应用
美团外卖广告智能算力的探索与实践
美团民宿跨端复用框架设计与实践
SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案
CVPR 2021 | 基于Transformer的端到端视频实例分割方法
外卖商品的标准化建设与应用
美团外卖美食知识图谱的迭代及应用
外卖套餐搭配的探索和应用
百亿规模API网关服务Shepherd的设计与实现
算法平台在线服务体系的演进与实践
GraphQL及元数据驱动架构在后端BFF中的实践
美团Serverless平台Nest的探索与实践
美团酒旅数据治理实践
实践之后,我们来谈谈如何做好威胁建模
对话美团自动驾驶掌门人:无人配送车已商用,累计送货3万单
美团弹性伸缩系统的技术演进与落地实践
美团图数据库平台建设及业务实践
美团AutoML论文:鲁棒的神经网络架构搜索 DARTS-
Flutter Web在美团外卖的实践
OCTO 2.0:美团基于Service Mesh的服务治理系统详解
美团外卖特征平台的建设与实践
一款可让大型iOS工程编译速度提升50%的工具
从预编译的角度理解Swift与Objective-C及混编机制
美团技术年货:1300+页电子书,覆盖前端、后台、数据、算法、顶会论文……...
自动驾驶轨迹预测算法:NeurIPS挑战赛冠军方案
让 Flutter 在鸿蒙系统上跑起来
基于SSD的Kafka应用层缓存架构设计与实现
速度与压缩比如何兼得?压缩算法在构建部署中的优化
2020年美团技术团队最受欢迎的16篇技术文章
隐藏在浏览器背后的“黑手”
技术解析 | 横纵一体的无人车控制方案
C++服务编译耗时优化原理及实践
ICDM论文:探索跨会话信息感知的推荐模型
复杂环境下落地Service Mesh的挑战与实践
美团无人车引擎在仿真中的实践
移动端UI一致性解决方案
Apache Kylin的实践与优化
Java中9种常见的CMS GC问题分析与解决
积木Sketch插件进阶开发指南
Native地图与Web融合技术的应用与实践
基本功 | Java即时编译器原理解析及实践
AIOps在美团的探索与实践——故障发现篇
外卖客户端容器化架构的演进
Flutter包大小治理上的探索与实践
KDD Cup 2020 自动图学习比赛冠军技术方案及在美团广告的实践
MT-BERT在文本检索任务中的实践
KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践
Kubernetes如何改变美团的云基础设施?
新一代垃圾回收器ZGC的探索与实践
美团搜索中NER技术的探索与实践
智能搜索模型预估框架的建设与实践
BERT在美团搜索核心排序的探索和实践
美团万亿级 KV 存储架构与实践
美团里的科学家和外卖中的 AI
美团外卖Flutter动态化实践
MyBatis版本升级引发的线上告警回顾及原理分析
ICRA 2020轨迹预测竞赛冠军的方法总结
美团MySQL数据库巡检系统的设计与应用
美团配送A/B评估体系建设与实践
美团无人配送CVPR2020论文CenterMask解读
积木Sketch Plugin:设计同学的贴心搭档
美团命名服务的挑战与演进
复杂风控场景下,如何打造一款高效的规则引擎
美团OCTO万亿级数据中心计算引擎技术解析
Transformer 在美团搜索排序中的实践
Intel PAUSE指令变化影响到MySQL的性能,该如何解决?
Apache Doris在美团外卖数仓中的应用实践
Java线程池实现原理及其在美团业务中的实践
设计模式在美团外卖营销业务中的实践
美团配送数据治理实践
云原生之容器安全实践
微前端在美团外卖的实践
智能配送系统的运筹优化实战
美团外卖持续交付的前世今生
自然场景人脸检测技术实践
美团开源Logan Web:前端日志在Web端的实现
Bifrost微前端框架及其在美团闪购中的实践
React Native在美团外卖客户端的实践
美团下一代服务治理系统 OCTO2.0 的探索与实践
从ReentrantLock的实现看AQS的原理及应用
美团点评效果广告实验配置平台的设计与实现
美团外卖前端容器化演进实践
Jupyter在美团民宿的应用实践
基于神经网络StarNet的行人轨迹交互预测算法
美团BERT的探索和实践
Probe:Android线上OOM问题定位组件
Android静态代码扫描效率优化与实践
Java 动态调试技术原理及实践
CVPR 2019轨迹预测竞赛冠军方法总结
Android兼容Java 8语法特性的原理分析
OneData建设探索之路:SaaS收银运营数仓建设
配送交付时间轻量级预估实践
JVM CPU Profiler技术原理及源码深度解析
开源React Native组件库beeshell 2.0发布
ICDAR 2019论文:自然场景文字定位技术详解
Litho在动态化方案MTFlexbox中的实践
降低软件复杂性的一般原则和方法
Litho在动态化方案MTFlexbox中的实践
降低软件复杂性的一般原则和方法
美团外卖商家端视频探索之旅
美团集群调度系统HULK技术演进
美团集群调度系统HULK技术演进
Android视频技术探索之旅:美团外卖商家端的实践
Java字节码增强探秘
美团点评Kubernetes集群管理实践
MTFlexbox自动化埋点探索
XGBoost缺失值引发的问题及其深度分析
MTFlexbox自动化埋点探索
美团 iOS 工程 zsource 命令背后的那些事儿
美团大规模微服务通信框架及治理体系OCTO核心组件开源
ESLint 在中大型团队的应用实践
Hadoop YARN:调度性能优化实践
Litho的使用及原理剖析
大众点评信息流基于文本生成的创意优化实践
Litho的使用及原理剖析
活动 Web 页面人机识别验证的探索与实践
Leaf:美团分布式ID生成服务开源
助力中文文字识别突破,美团公开首个真实场景招牌图像数据集
根因分析初探:一种报警聚类算法在业务系统的落地实施
Java动态追踪技术探究
Java动态追踪技术探究
深度学习在美团配送ETA预估中的探索与实践
研发团队资源成本优化实践
WSDM Cup 2019自然语言推理任务获奖解题思路
Java魔法类——Unsafe应用解析
将军令:数据安全平台建设实践
全链路压测自动化实践
AI Challenger 2018:细粒度用户评论情感分类冠军思路总结
React Native工程中TSLint静态检查工具的探索之路
大众点评搜索基于知识图谱的深度学习排序实践
保障IDC安全:分布式HIDS集群架构设计
客户端单周发版下的多分支自动化管理与实践
深度学习在搜索业务中的探索与实践
Spring Boot引起的“堆外内存泄漏”排查及经验总结
Spring Boot内存泄露排查记
AI技术在智能海报设计中的应用
iOS 覆盖率检测原理与增量代码测试覆盖率工具实现
CSDN专访:吃喝玩乐背后的黑科技
iOS 增量代码覆盖率检测实践
深入浅出排序学习:写给程序员的算法系统开发实践
LruCache在美团DSP系统中的应用演进
Android组件化方案及组件消息总线modular-event实战
机器学习在美团配送系统的实践:用技术还原真实世界
智能支付稳定性测试实战
数据库智能运维探索与实践
美团智能支付稳定性测试实战
iOS App冷启动治理:来自美团外卖的实践
美团DB数据同步到数据仓库的架构与实践
机器学习、知识图谱、ETA,美团专家AICon大会开讲啦!
美团即时物流的分布式系统架构设计
新一代数据库TiDB在美团的实践
Hades:移动端静态分析框架
美团餐饮娱乐知识图谱——美团大脑揭秘
前端黑科技:美团网页首帧优化实践
不可不说的Java“锁”事
强化学习在美团“猜你喜欢”的实践
美团容器平台架构及容器技术实践
不可不说的Java“锁”事
Category 特性在 iOS 组件化中的应用与管控
浅谈大型互联网企业入侵检测及防护策略
浅谈大型互联网的企业入侵检测及防护策略
深入剖析Swift性能优化
美团大脑:知识图谱的建模方法及其应用
CAT 3.0 开源发布,支持多语言客户端及多项性能提升
iOS系统中导航栏的转场解决方案与最佳实践
美团深度学习系统的工程实践
Netty堆外内存泄露排查与总结
美团点评基于 Flink 的实时数仓建设实践
如何防止CSRF攻击?
基于TensorFlow Serving的深度学习在线预估
Logan:美团点评的开源移动端基础日志库
如何防止CSRF攻击?
如何防止XSS攻击?
beeshell:开源的 React Native 组件库
深度学习、监控体系与运营配置平台,美团技术专家QCon开讲啦
如何防止XSS攻击?
美团外卖Android平台化的复用实践
APPKIT打造稳定、灵活、高效的运营配置平台
全链路压测平台(Quake)在美团中的实践
ARKit:增强现实技术在美团到餐业务的实践
美团扫码付小程序的优化实践
用微前端的方式搭建类单页应用
Oceanus:美团HTTP流量定制化路由的实践
Oceanus:美团点评HTTP流量定制化路由的实践
WMRouter:美团外卖Android开源路由框架
深入理解JSCore
深入理解JavaScriptCore
美团技术团队当家运营:美美正式出道啦(含福利)
美团在O2O场景下的广告营销
写给工程师的十条精进原则
美团O2O广告营销中的机器学习技术
Flutter原理与美团的实践
美团扫码付的前端可用性保障实践
Flutter的原理及美团的实践
Jenkins的Pipeline脚本在美团餐饮SaaS中的实践
美团 R 语言数据运营实战
美团针对Redis Rehash机制的探索和实践
美团配送系统架构演进实践
用LiveDataBus替代RxBus、EventBus——Android消息总线的演进之路
美团服务体验平台对接业务数据的最佳实践-海盗中间件
海盗中间件:美团服务体验平台对接业务数据的最佳实践
Android消息总线的演进之路:用LiveDataBus替代RxBus、EventBus
美团客户端响应式框架 EasyReact 开源啦
美团点评云真机平台实践
美团客户端响应式框架EasyReact开源啦
MCI:移动持续集成在大众点评的实践
如何基于深度学习实现图像的智能审核?
Android自动化页面测速在美团的实践
MCI:大众点评千人移动研发团队怎样做持续集成?
美团如何基于深度学习实现图像的智能审核?
前端遇上Go: 静态资源增量更新的新实践
Kotlin代码检查在美团的探索与实践
UAS:大众点评用户行为系统
全球AI技术开放日之走进美团 :探索美团外卖背后的AI大脑
美团外卖iOS多端复用的推动、支撑与思考
强化学习、分布式系统、机器学习,美团专家ArchSummit开讲啦
Picasso:开启大前端的未来
WWDC案例解读:大众点评相机直接扫描支付是怎么实现的
美团外卖Android Crash治理之路
深度学习在美团搜索广告排序的应用实践
大众点评账号业务高可用进阶之路
2000万日订单背后:美团外卖客户端高可用建设体系
互联网企业:如何建设数据安全体系?
SQL解析在美团点评中的应用
美团点评数据平台Kerberos优化实战
美团点评广告实时索引的设计与实现
质量运营在智能支付业务测试中的初步实践
互联网公司数据安全保护新探索
质量运营在美团点评智能支付业务测试中的初步实践
Ruby在QA自动化中的应用
插件化、热补丁中绕不开的Proguard的坑
Android插件化、热补丁中绕不开的ProGuard的坑
高可用:美团点评智能支付核心交易系统的可用性实践
大数据:美团酒旅实时数据规则引擎应用实践
美团酒旅实时数据规则引擎应用实践
在架构师眼里,一份美团外卖是如何做出来的?
工作中如何做好技术积累
移动开发:美团外卖Android Lint代码检查实践
工程师如何在工作中提升自己?
使用TensorFlow训练WDL模型性能问题定位与调优
Toast与Snackbar的那点事
美团“猜你喜欢”深度学习排序模型实践
美团外卖骑手背后的AI技术
美团配送资金安全治理之对账体系建设
DataMan-美团旅行数据质量监管平台实践
每天数百亿用户行为数据,美团点评怎么实现秒级转化分析?
DataMan:美团旅行数据质量监管平台实践
美团配送资金安全治理之对账体系建设
DataMan-美团旅行数据质量监管平台实践
美团旅行销售绩效系统研发实践
Redis 高负载下的中断优化
美团点评金融平台Web前端技术体系
美团外卖Android平台化架构演进实践
Redis高负载下的中断优化
使用Vue.js开发微信小程序:开源框架mpvue解析
大众点评App的短视频耗电量优化实战
Android动态日志系统Holmes
美团点评运营数据产品化应用与实践
美团点评移动端基础日志库——Logan
Logan:美团点评移动端基础日志库揭秘
美团点评运营数据产品化实战
深度学习及AR在移动端打车场景下的应用
流量运营数据产品最佳实践——美团旅行流量罗盘
Android Hook技术防范漫谈
美团点评基于Storm的实时数据处理实践
初探下一代网络隔离与访问控制
聊聊MyBatis缓存机制
境外业务性能优化实践
卫星系统——酒店后端全链路日志收集工具介绍
高性能平台设计—美团旅行结算平台实践
微服务拆分过细?“卫星”系统帮你做日志收集无遗漏
高性能平台设计——美团旅行结算平台实践
MSON,让JSON序列化更快
Lego:美团点评接口自动化测试实践
智能投放系统之场景分析最佳实践
从实际案例聊聊Java应用的GC优化
Shield——开源的移动端页面模块化开发框架
美团金融扫码付静态资源加载优化实践
领域驱动设计在互联网业务开发中的实践
大家一直在谈的领域驱动设计(DDD),我们在互联网业务系统是这么实践的
Shield:支撑美团点评品类最丰富业务的移动端模块化框架开源了
智能分析最佳实践——指标逻辑树
美团点评联盟广告场景化定向排序机制
美团点评联盟广告的场景化定向排序机制
即时配送的ETA问题之亿级样本特征构造实践
这个团队做的事情,每天为美团平台带来50%以上的交易量
流计算框架 Flink 与 Storm 的性能对比
MyFlash——美团点评的开源MySQL闪回工具
美团外卖自动化业务运维系统建设
美团外卖自动化业务运维系统——Alfred
大圣魔方——美团点评酒旅BI报表工具平台开发实践
美团点评境外度假团队前端项目开发实践总结
支付通道自动化管理的实践之路
互联网企业安全之端口监控
【揭秘】美团外卖日单量破1600万背后的“超级大脑”之订单分配
美团App插件化实践
美团App 插件化实践
函数式编程在Redux/React中的应用
即时配送的订单分配策略:从建模和优化
iPhone X 刘海打理指北
Spring Data REST 远程代码执行漏洞(CVE-2017-8046)分析与复现
这个Spring高危漏洞,你修补了吗?
前端感官性能的衡量和优化实践
人工智能在线特征系统中的生产调度
Android Binder漏洞挖掘技术与案例
监控平台前端SDK开发实践
美团和大众点评两大数据平台是怎么融合的
美团点评数据平台融合实践
Android漏洞扫描工具Code Arbiter
前端可用性保障实践
云端的SRE发展与实践
深度学习在美团点评推荐平台排序中的运用
Android远程调试的探索与实现
sysbench在美团点评中的应用
Redux从设计到源码
人工智能在线特征系统中的数据存取技术
LsLoader——通用移动端Web App离线化方案
孵化业务快速落地与优化
美团点评数据库高可用架构的演进与设想
美团点评酒店后台故障演练系统
客户端自动化测试研究
Android增量代码测试覆盖率工具
美团点评旅游搜索召回策略的演进
WebView性能、体验分析与优化
从0到1:构建强大且易用的规则引擎
Hyperloop,让发布简洁高效
美团点评酒旅数据仓库建设实践
磁盘I/O那些事
纠删码存储系统中的投机性部分写技术
美团点评容器平台HULK的调度系统
美团点评酒旅前端的技术体系
机器学习中模型优化不得不思考的几个问题
美团DSP广告策略实践
基于rsync的文件增量同步方案
Vuex框架原理与源码分析
Leaf——美团点评分布式ID生成系统
外卖订单量预测异常报警模型实践
HDFS Federation在美团点评的应用与改进
Android OOM案例分析
Android App包瘦身优化实践
从Google白皮书看企业安全最佳实践
旅游推荐系统的演进
前端渲染引擎doT.js解析
美团点评移动网络优化实践
Android热更新方案Robust开源,新增自动化补丁工具
HDFS NameNode重启优化
缓存那些事
美团外卖前端可视化界面组装平台 —— 乐高
美团点评SQL优化工具SQLAdvisor开源
Android自定义Lint实践2——改进原生Detector
美团点评前端无痕埋点实践
业务赋能利器之外卖特征档案
布局编码的未来
Mt-Falcon——Open-Falcon在美团点评的应用与实践
日志级别动态调整——小工具解决大问题
外卖O2O的用户画像实践
深度学习在美团点评的应用
美团点评Docker容器管理平台
聊聊clean code
Android硬件加速原理与实现简介
美团点评业务风控系统构建经验
新一代开源Android渠道包生成工具Walle
美团点评数据库中间件DBProxy开源
前端工程化开发方案app-proto
MGW——美团点评高性能四层负载均衡
美团团购订单系统优化记
美团酒店直连产品数据一致性演进
MTDDL——美团点评分布式数据访问层中间件
移动端性能监控方案Hertz
外卖排序系统特征生产框架
常见性能优化策略的总结
红黑树深入剖析及Java实现
CRM系统新思维
Appium 的 Android UI 自动化测试
大众点评订单系统分库分表实践
高性能队列——Disruptor
如何构建Android MVVM 应用框架
服务容错模式
Java NIO浅析
Spark Streaming + Elasticsearch构建App异常监控平台
深度剖析开源分布式监控CAT
Storm 的可靠性保证测试
移动App兼容性测试工具Spider
分布式会话跟踪系统架构设计与实践
ReactiveCocoa核心元素与信号流
Spring MVC注解故障追踪记
大促活动前团购系统流量预算和容量评估
Java Hotspot G1 GC的一些关键技术
Android热更新方案Robust
美团点评的DBProxy实践
美团外卖订单中心的演进
基于 KIF 的 iOS UI 自动化测试和持续集成
HDFS NameNode内存全景
ReactiveCocoa潜在的内存泄漏及解决方案
RestQL:现代化的 API 开发方式
分布式队列编程优化篇
分布式队列编程:模型、实战
Node.js Stream - 实战篇
Node.js Stream - 进阶篇
Node.js Stream - 基础篇
消息队列设计精要
Java 8 HashMap
Cache服务过载案例研究
大众点评支付渠道网关系统的实践
Spark性能优化指南——高级篇
Spark性能优化指南——基础篇
Online Learning算法理论与实践
数据驱动精准化营销在大众点评的实践
美团Spark实践
使用模板快速编写测试用例
Android自定义Lint实践
分布式块存储系统Ursa的设计与实现
深入FFM原理与实践
高可用性系统在大众点评的实践与经验
从0到1构建美团压测工具
Android单元测试研究与实践
性能优化模式
美团O2O排序解决方案——线下篇
美团O2O排序解决方案——线上篇
ReactiveCocoa的冷信号与热信号(三):怎么处理冷信号与热信号
npm shrinkwrap 管理项目依赖
美团Mock Server实践
美团Android资源混淆保护实践
ReactiveCocoa的冷信号与热信号(二):为什么要区分冷热信号
ReactiveCocoa的冷信号与热信号(一)
深入理解Objective-C:方法缓存
前端组件化开发实践
RACSignal的Subscription深入分析
美团酒店Node全栈开发实践
美团Android DEX自动拆包及动态加载
Logistic Regression 模型
Linux资源管理之cgroups简介
Docker系列之二:基于容器的自动构建
深入理解Objective-C:Category
序列化和反序列化
机器学习中的数据清洗与特征处理
详解机器学习如何解决问题
Docker 入门介绍
高级语言的编译:链接及装载过程
美团推荐算法实践
Kafka文件存储机制
基于机器学习方法的POI品类推荐算法
美团性能分析框架和性能监控平台
抽象语法树在 JavaScript 中的应用
Java内存访问重排序的研究
OpenTSDB 造成 Hbase 整点压力过大问题的排查和解决
地理空间距离计算优化
Solr空间搜索原理分析与实践
美团Android适配渠道包
Wi-Fi室内定位在美团总部的实践和应用
美团数据仓库-数据脱敏
Git自动提取、合并提交
Hadoop安全实践
美团COS系统的前端演变
iBeacon 初探
深入解析String#intern
美团性能指标体系实践
Hadoop集群服务器cpu sys态异常的定位与解决
搜索引擎关键字智能提示的实现
YUI自定义事件默认行为
Hive SQL的编译过程
YUI事件体系之Y.EventTarget
YUI事件体系之Y.CustomEvent
YUI事件体系之Y.Do
美团数据开放平台的配置管理
美团Flume日志收集系统改进和优化
美团Flume日志收集系统架构和设计
美团数据仓库的演进
美团前端YUI3实践
Kafka 数据平台实践
美团技术实践
Log4j2日志导致线程Block的问题剖析
可视化全链路日志追踪实践
美团技术团队精选论文解读
美团CI/CD流水线引擎的建设实践
美团外卖广告大规模深度学习模型实践
大众点评搜索相关性技术探索与实践
CVPR2022 美团技术团队精选论文解读
美团目标检测框架
美团综合业务推荐系统的质量模型及实践
美团小样本学习训练实战
数据库全量SQL分析与审计系统性能优化
Android so体积优化的探索与实践
美团对话摘要技术实践
如何应对开源组件⻛险
端智能在大众点评搜索重排序的应用实践
美团图神经网络训练框架的实践和探索
CompletableFuture原理与实践-外卖商家端API的异步化
业务数据治理体系化思考与实践
2022年美团科研合作课题公开征集启动
数据库异常智能分析与诊断
标准化思想及组装式架构在后端BFF中的实践
美团外卖广告智能算力的探索与实践(二)
基于代价的慢查询优化建议
Linux下跨语言调用C++实践
短视频内容理解与生成技术在美团的创新实践
知识图谱可视化技术在美团的实践与探索
Linux中基于eBPF的恶意利用与检测机制
终端新玩法:“零代码”的剧本式引导
Twins:重新思考高效的视觉注意力模型设计
TensorFlow在美团外卖推荐场景的GPU训练优化实践
远程热部署在美团的落地实践
设计模式二三事
异构广告混排在美团到店业务的探索与实践
GPU在外卖场景精排模型预估中的应用实践
美团外卖广告平台化的探索与实践
数据治理一体化实践之体系化建模
美团集群调度系统的云原生实践
美团搜索中查询改写技术的探索与实践
从0到1:美团端侧CDN容灾解决方案
FlutterWeb性能优化探索与实践
TensorFlow在推荐系统中的分布式训练优化实践
细粒度情感分析在到餐场景中的应用
美团外卖终端容器无关化研发框架
预训练技术在美团到店搜索广告中的应用
Fairplay DRM与混淆实现的研究
美团跨端一体化富文本管理技术实践
美团搜索多业务商品排序探索与实践
美团知识图谱问答技术实践与探索
美团基于知识图谱的剧本杀标准化建设与应用
情感分析技术在美团的探索与应用
美团智能客服核心技术与实践
如何优雅地记录操作日志?
新一代CTR预测服务的GPU优化实践
美团商品知识图谱的构建及应用
美团外卖实时数仓建设实践
小样本学习及其在美团场景中的应用
Spock单元测试框架以及在美团优选的实践
美团App页面视图可测性改造实践
美团终端消息投递服务Pike的演进之路
本地生活综合性需求图谱的构建及应用
多业务建模在美团搜索排序中的实践
常识性概念图谱建设以及在美团场景中的应用
美团外卖广告智能算力的探索与实践
美团民宿跨端复用框架设计与实践
SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案
CVPR 2021 | 基于Transformer的端到端视频实例分割方法
外卖商品的标准化建设与应用
美团外卖美食知识图谱的迭代及应用
外卖套餐搭配的探索和应用
百亿规模API网关服务Shepherd的设计与实现
算法平台在线服务体系的演进与实践
GraphQL及元数据驱动架构在后端BFF中的实践
美团Serverless平台Nest的探索与实践
美团酒旅数据治理实践
实践之后,我们来谈谈如何做好威胁建模
对话美团自动驾驶掌门人:无人配送车已商用,累计送货3万单
美团弹性伸缩系统的技术演进与落地实践
美团图数据库平台建设及业务实践
美团AutoML论文:鲁棒的神经网络架构搜索 DARTS-
Flutter Web在美团外卖的实践
OCTO 2.0:美团基于Service Mesh的服务治理系统详解
美团外卖特征平台的建设与实践
一款可让大型iOS工程编译速度提升50%的工具
从预编译的角度理解Swift与Objective-C及混编机制
美团技术年货:1300+页电子书,覆盖前端、后台、数据、算法、顶会论文……...
自动驾驶轨迹预测算法:NeurIPS挑战赛冠军方案
让 Flutter 在鸿蒙系统上跑起来
基于SSD的Kafka应用层缓存架构设计与实现
速度与压缩比如何兼得?压缩算法在构建部署中的优化
2020年美团技术团队最受欢迎的16篇技术文章
隐藏在浏览器背后的“黑手”
技术解析 | 横纵一体的无人车控制方案
C++服务编译耗时优化原理及实践
ICDM论文:探索跨会话信息感知的推荐模型
复杂环境下落地Service Mesh的挑战与实践
美团无人车引擎在仿真中的实践
移动端UI一致性解决方案
Apache Kylin的实践与优化
Java中9种常见的CMS GC问题分析与解决
积木Sketch插件进阶开发指南
Native地图与Web融合技术的应用与实践
基本功 | Java即时编译器原理解析及实践
AIOps在美团的探索与实践——故障发现篇
外卖客户端容器化架构的演进
Flutter包大小治理上的探索与实践
KDD Cup 2020 自动图学习比赛冠军技术方案及在美团广告的实践
MT-BERT在文本检索任务中的实践
KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践
Kubernetes如何改变美团的云基础设施?
新一代垃圾回收器ZGC的探索与实践
美团搜索中NER技术的探索与实践
智能搜索模型预估框架的建设与实践
BERT在美团搜索核心排序的探索和实践
美团万亿级 KV 存储架构与实践
美团里的科学家和外卖中的 AI
美团外卖Flutter动态化实践
MyBatis版本升级引发的线上告警回顾及原理分析
ICRA 2020轨迹预测竞赛冠军的方法总结
美团MySQL数据库巡检系统的设计与应用
美团配送A/B评估体系建设与实践
美团无人配送CVPR2020论文CenterMask解读
积木Sketch Plugin:设计同学的贴心搭档
美团命名服务的挑战与演进
复杂风控场景下,如何打造一款高效的规则引擎
美团OCTO万亿级数据中心计算引擎技术解析
Transformer 在美团搜索排序中的实践
Intel PAUSE指令变化影响到MySQL的性能,该如何解决?
Apache Doris在美团外卖数仓中的应用实践
Java线程池实现原理及其在美团业务中的实践
设计模式在美团外卖营销业务中的实践
美团配送数据治理实践
云原生之容器安全实践
微前端在美团外卖的实践
智能配送系统的运筹优化实战
美团外卖持续交付的前世今生
自然场景人脸检测技术实践
美团开源Logan Web:前端日志在Web端的实现
Bifrost微前端框架及其在美团闪购中的实践
React Native在美团外卖客户端的实践
美团下一代服务治理系统 OCTO2.0 的探索与实践
从ReentrantLock的实现看AQS的原理及应用
美团点评效果广告实验配置平台的设计与实现
美团外卖前端容器化演进实践
Jupyter在美团民宿的应用实践
基于神经网络StarNet的行人轨迹交互预测算法
美团BERT的探索和实践
Probe:Android线上OOM问题定位组件
Android静态代码扫描效率优化与实践
Java 动态调试技术原理及实践
CVPR 2019轨迹预测竞赛冠军方法总结
Android兼容Java 8语法特性的原理分析
OneData建设探索之路:SaaS收银运营数仓建设
配送交付时间轻量级预估实践
JVM CPU Profiler技术原理及源码深度解析
开源React Native组件库beeshell 2.0发布
ICDAR 2019论文:自然场景文字定位技术详解
Litho在动态化方案MTFlexbox中的实践
降低软件复杂性的一般原则和方法
Litho在动态化方案MTFlexbox中的实践
降低软件复杂性的一般原则和方法
美团外卖商家端视频探索之旅
美团集群调度系统HULK技术演进
美团集群调度系统HULK技术演进
Android视频技术探索之旅:美团外卖商家端的实践
Java字节码增强探秘
美团点评Kubernetes集群管理实践
MTFlexbox自动化埋点探索
XGBoost缺失值引发的问题及其深度分析
MTFlexbox自动化埋点探索
美团 iOS 工程 zsource 命令背后的那些事儿
美团大规模微服务通信框架及治理体系OCTO核心组件开源
ESLint 在中大型团队的应用实践
Hadoop YARN:调度性能优化实践
Litho的使用及原理剖析
大众点评信息流基于文本生成的创意优化实践
Litho的使用及原理剖析
活动 Web 页面人机识别验证的探索与实践
Leaf:美团分布式ID生成服务开源
助力中文文字识别突破,美团公开首个真实场景招牌图像数据集
根因分析初探:一种报警聚类算法在业务系统的落地实施
Java动态追踪技术探究
Java动态追踪技术探究
深度学习在美团配送ETA预估中的探索与实践
研发团队资源成本优化实践
WSDM Cup 2019自然语言推理任务获奖解题思路
Java魔法类——Unsafe应用解析
将军令:数据安全平台建设实践
全链路压测自动化实践
AI Challenger 2018:细粒度用户评论情感分类冠军思路总结
React Native工程中TSLint静态检查工具的探索之路
大众点评搜索基于知识图谱的深度学习排序实践
保障IDC安全:分布式HIDS集群架构设计
客户端单周发版下的多分支自动化管理与实践
深度学习在搜索业务中的探索与实践
Spring Boot引起的“堆外内存泄漏”排查及经验总结
Spring Boot内存泄露排查记
AI技术在智能海报设计中的应用
iOS 覆盖率检测原理与增量代码测试覆盖率工具实现
CSDN专访:吃喝玩乐背后的黑科技
iOS 增量代码覆盖率检测实践
深入浅出排序学习:写给程序员的算法系统开发实践
LruCache在美团DSP系统中的应用演进
Android组件化方案及组件消息总线modular-event实战
机器学习在美团配送系统的实践:用技术还原真实世界
智能支付稳定性测试实战
数据库智能运维探索与实践
美团智能支付稳定性测试实战
iOS App冷启动治理:来自美团外卖的实践
美团DB数据同步到数据仓库的架构与实践
机器学习、知识图谱、ETA,美团专家AICon大会开讲啦!
美团即时物流的分布式系统架构设计
新一代数据库TiDB在美团的实践
Hades:移动端静态分析框架
美团餐饮娱乐知识图谱——美团大脑揭秘
前端黑科技:美团网页首帧优化实践
不可不说的Java“锁”事
强化学习在美团“猜你喜欢”的实践
美团容器平台架构及容器技术实践
不可不说的Java“锁”事
Category 特性在 iOS 组件化中的应用与管控
浅谈大型互联网企业入侵检测及防护策略
浅谈大型互联网的企业入侵检测及防护策略
深入剖析Swift性能优化
美团大脑:知识图谱的建模方法及其应用
CAT 3.0 开源发布,支持多语言客户端及多项性能提升
iOS系统中导航栏的转场解决方案与最佳实践
美团深度学习系统的工程实践
Netty堆外内存泄露排查与总结
美团点评基于 Flink 的实时数仓建设实践
如何防止CSRF攻击?
基于TensorFlow Serving的深度学习在线预估
Logan:美团点评的开源移动端基础日志库
如何防止CSRF攻击?
如何防止XSS攻击?
beeshell:开源的 React Native 组件库
深度学习、监控体系与运营配置平台,美团技术专家QCon开讲啦
如何防止XSS攻击?
美团外卖Android平台化的复用实践
APPKIT打造稳定、灵活、高效的运营配置平台
全链路压测平台(Quake)在美团中的实践
ARKit:增强现实技术在美团到餐业务的实践
美团扫码付小程序的优化实践
用微前端的方式搭建类单页应用
Oceanus:美团HTTP流量定制化路由的实践
Oceanus:美团点评HTTP流量定制化路由的实践
WMRouter:美团外卖Android开源路由框架
深入理解JSCore
深入理解JavaScriptCore
美团技术团队当家运营:美美正式出道啦(含福利)
美团在O2O场景下的广告营销
写给工程师的十条精进原则
美团O2O广告营销中的机器学习技术
Flutter原理与美团的实践
美团扫码付的前端可用性保障实践
Flutter的原理及美团的实践
Jenkins的Pipeline脚本在美团餐饮SaaS中的实践
美团 R 语言数据运营实战
美团针对Redis Rehash机制的探索和实践
美团配送系统架构演进实践
用LiveDataBus替代RxBus、EventBus——Android消息总线的演进之路
美团服务体验平台对接业务数据的最佳实践-海盗中间件
海盗中间件:美团服务体验平台对接业务数据的最佳实践
Android消息总线的演进之路:用LiveDataBus替代RxBus、EventBus
美团客户端响应式框架 EasyReact 开源啦
美团点评云真机平台实践
美团客户端响应式框架EasyReact开源啦
MCI:移动持续集成在大众点评的实践
如何基于深度学习实现图像的智能审核?
Android自动化页面测速在美团的实践
MCI:大众点评千人移动研发团队怎样做持续集成?
美团如何基于深度学习实现图像的智能审核?
前端遇上Go: 静态资源增量更新的新实践
Kotlin代码检查在美团的探索与实践
UAS:大众点评用户行为系统
全球AI技术开放日之走进美团 :探索美团外卖背后的AI大脑
美团外卖iOS多端复用的推动、支撑与思考
强化学习、分布式系统、机器学习,美团专家ArchSummit开讲啦
Picasso:开启大前端的未来
WWDC案例解读:大众点评相机直接扫描支付是怎么实现的
美团外卖Android Crash治理之路
深度学习在美团搜索广告排序的应用实践
大众点评账号业务高可用进阶之路
2000万日订单背后:美团外卖客户端高可用建设体系
互联网企业:如何建设数据安全体系?
SQL解析在美团点评中的应用
美团点评数据平台Kerberos优化实战
美团点评广告实时索引的设计与实现
质量运营在智能支付业务测试中的初步实践
互联网公司数据安全保护新探索
质量运营在美团点评智能支付业务测试中的初步实践
Ruby在QA自动化中的应用
插件化、热补丁中绕不开的Proguard的坑
Android插件化、热补丁中绕不开的ProGuard的坑
高可用:美团点评智能支付核心交易系统的可用性实践
大数据:美团酒旅实时数据规则引擎应用实践
美团酒旅实时数据规则引擎应用实践
在架构师眼里,一份美团外卖是如何做出来的?
工作中如何做好技术积累
移动开发:美团外卖Android Lint代码检查实践
工程师如何在工作中提升自己?
使用TensorFlow训练WDL模型性能问题定位与调优
Toast与Snackbar的那点事
美团“猜你喜欢”深度学习排序模型实践
美团外卖骑手背后的AI技术
美团配送资金安全治理之对账体系建设
DataMan-美团旅行数据质量监管平台实践
每天数百亿用户行为数据,美团点评怎么实现秒级转化分析?
DataMan:美团旅行数据质量监管平台实践
美团配送资金安全治理之对账体系建设
DataMan-美团旅行数据质量监管平台实践
美团旅行销售绩效系统研发实践
Redis 高负载下的中断优化
美团点评金融平台Web前端技术体系
美团外卖Android平台化架构演进实践
Redis高负载下的中断优化
使用Vue.js开发微信小程序:开源框架mpvue解析
大众点评App的短视频耗电量优化实战
Android动态日志系统Holmes
美团点评运营数据产品化应用与实践
美团点评移动端基础日志库——Logan
Logan:美团点评移动端基础日志库揭秘
美团点评运营数据产品化实战
深度学习及AR在移动端打车场景下的应用
流量运营数据产品最佳实践——美团旅行流量罗盘
Android Hook技术防范漫谈
美团点评基于Storm的实时数据处理实践
初探下一代网络隔离与访问控制
聊聊MyBatis缓存机制
境外业务性能优化实践
卫星系统——酒店后端全链路日志收集工具介绍
高性能平台设计—美团旅行结算平台实践
微服务拆分过细?“卫星”系统帮你做日志收集无遗漏
高性能平台设计——美团旅行结算平台实践
MSON,让JSON序列化更快
Lego:美团点评接口自动化测试实践
智能投放系统之场景分析最佳实践
从实际案例聊聊Java应用的GC优化
Shield——开源的移动端页面模块化开发框架
美团金融扫码付静态资源加载优化实践
领域驱动设计在互联网业务开发中的实践
大家一直在谈的领域驱动设计(DDD),我们在互联网业务系统是这么实践的
Shield:支撑美团点评品类最丰富业务的移动端模块化框架开源了
智能分析最佳实践——指标逻辑树
美团点评联盟广告场景化定向排序机制
美团点评联盟广告的场景化定向排序机制
即时配送的ETA问题之亿级样本特征构造实践
这个团队做的事情,每天为美团平台带来50%以上的交易量
流计算框架 Flink 与 Storm 的性能对比
MyFlash——美团点评的开源MySQL闪回工具
美团外卖自动化业务运维系统建设
美团外卖自动化业务运维系统——Alfred
大圣魔方——美团点评酒旅BI报表工具平台开发实践
美团点评境外度假团队前端项目开发实践总结
支付通道自动化管理的实践之路
互联网企业安全之端口监控
【揭秘】美团外卖日单量破1600万背后的“超级大脑”之订单分配
美团App插件化实践
美团App 插件化实践
函数式编程在Redux/React中的应用
即时配送的订单分配策略:从建模和优化
iPhone X 刘海打理指北
Spring Data REST 远程代码执行漏洞(CVE-2017-8046)分析与复现
这个Spring高危漏洞,你修补了吗?
前端感官性能的衡量和优化实践
人工智能在线特征系统中的生产调度
Android Binder漏洞挖掘技术与案例
监控平台前端SDK开发实践
美团和大众点评两大数据平台是怎么融合的
美团点评数据平台融合实践
Android漏洞扫描工具Code Arbiter
前端可用性保障实践
云端的SRE发展与实践
深度学习在美团点评推荐平台排序中的运用
Android远程调试的探索与实现
sysbench在美团点评中的应用
Redux从设计到源码
人工智能在线特征系统中的数据存取技术
LsLoader——通用移动端Web App离线化方案
孵化业务快速落地与优化
美团点评数据库高可用架构的演进与设想
美团点评酒店后台故障演练系统
客户端自动化测试研究
Android增量代码测试覆盖率工具
美团点评旅游搜索召回策略的演进
WebView性能、体验分析与优化
从0到1:构建强大且易用的规则引擎
Hyperloop,让发布简洁高效
美团点评酒旅数据仓库建设实践
磁盘I/O那些事
纠删码存储系统中的投机性部分写技术
美团点评容器平台HULK的调度系统
美团点评酒旅前端的技术体系
机器学习中模型优化不得不思考的几个问题
美团DSP广告策略实践
基于rsync的文件增量同步方案
Vuex框架原理与源码分析
Leaf——美团点评分布式ID生成系统
外卖订单量预测异常报警模型实践
HDFS Federation在美团点评的应用与改进
Android OOM案例分析
Android App包瘦身优化实践
从Google白皮书看企业安全最佳实践
旅游推荐系统的演进
前端渲染引擎doT.js解析
美团点评移动网络优化实践
Android热更新方案Robust开源,新增自动化补丁工具
HDFS NameNode重启优化
缓存那些事
美团外卖前端可视化界面组装平台 —— 乐高
美团点评SQL优化工具SQLAdvisor开源
Android自定义Lint实践2——改进原生Detector
美团点评前端无痕埋点实践
业务赋能利器之外卖特征档案
布局编码的未来
Mt-Falcon——Open-Falcon在美团点评的应用与实践
日志级别动态调整——小工具解决大问题
外卖O2O的用户画像实践
深度学习在美团点评的应用
美团点评Docker容器管理平台
聊聊clean code
Android硬件加速原理与实现简介
美团点评业务风控系统构建经验
新一代开源Android渠道包生成工具Walle
美团点评数据库中间件DBProxy开源
前端工程化开发方案app-proto
MGW——美团点评高性能四层负载均衡
美团团购订单系统优化记
美团酒店直连产品数据一致性演进
MTDDL——美团点评分布式数据访问层中间件
移动端性能监控方案Hertz
外卖排序系统特征生产框架
常见性能优化策略的总结
红黑树深入剖析及Java实现
CRM系统新思维
Appium 的 Android UI 自动化测试
大众点评订单系统分库分表实践
高性能队列——Disruptor
如何构建Android MVVM 应用框架
服务容错模式
Java NIO浅析
Spark Streaming + Elasticsearch构建App异常监控平台
深度剖析开源分布式监控CAT
Storm 的可靠性保证测试
移动App兼容性测试工具Spider
分布式会话跟踪系统架构设计与实践
ReactiveCocoa核心元素与信号流
Spring MVC注解故障追踪记
大促活动前团购系统流量预算和容量评估
Java Hotspot G1 GC的一些关键技术
Android热更新方案Robust
美团点评的DBProxy实践
美团外卖订单中心的演进
基于 KIF 的 iOS UI 自动化测试和持续集成
HDFS NameNode内存全景
ReactiveCocoa潜在的内存泄漏及解决方案
RestQL:现代化的 API 开发方式
分布式队列编程优化篇
分布式队列编程:模型、实战
Node.js Stream - 实战篇
Node.js Stream - 进阶篇
Node.js Stream - 基础篇
消息队列设计精要
Java 8 HashMap
Cache服务过载案例研究
大众点评支付渠道网关系统的实践
Spark性能优化指南——高级篇
Spark性能优化指南——基础篇
Online Learning算法理论与实践
数据驱动精准化营销在大众点评的实践
美团Spark实践
使用模板快速编写测试用例
Android自定义Lint实践
分布式块存储系统Ursa的设计与实现
深入FFM原理与实践
高可用性系统在大众点评的实践与经验
从0到1构建美团压测工具
Android单元测试研究与实践
性能优化模式
美团O2O排序解决方案——线下篇
美团O2O排序解决方案——线上篇
ReactiveCocoa的冷信号与热信号(三):怎么处理冷信号与热信号
npm shrinkwrap 管理项目依赖
美团Mock Server实践
美团Android资源混淆保护实践
ReactiveCocoa的冷信号与热信号(二):为什么要区分冷热信号
ReactiveCocoa的冷信号与热信号(一)
深入理解Objective-C:方法缓存
前端组件化开发实践
RACSignal的Subscription深入分析
美团酒店Node全栈开发实践
美团Android DEX自动拆包及动态加载
Logistic Regression 模型
Linux资源管理之cgroups简介
Docker系列之二:基于容器的自动构建
深入理解Objective-C:Category
序列化和反序列化
机器学习中的数据清洗与特征处理
详解机器学习如何解决问题
Docker 入门介绍
高级语言的编译:链接及装载过程
美团推荐算法实践
Kafka文件存储机制
基于机器学习方法的POI品类推荐算法
美团性能分析框架和性能监控平台
抽象语法树在 JavaScript 中的应用
Java内存访问重排序的研究
OpenTSDB 造成 Hbase 整点压力过大问题的排查和解决
地理空间距离计算优化
Solr空间搜索原理分析与实践
美团Android适配渠道包
Wi-Fi室内定位在美团总部的实践和应用
美团数据仓库-数据脱敏
Git自动提取、合并提交
Hadoop安全实践
美团COS系统的前端演变
iBeacon 初探
深入解析String#intern
美团性能指标体系实践
Hadoop集群服务器cpu sys态异常的定位与解决
搜索引擎关键字智能提示的实现
YUI自定义事件默认行为
Hive SQL的编译过程
YUI事件体系之Y.EventTarget
YUI事件体系之Y.CustomEvent
YUI事件体系之Y.Do
美团数据开放平台的配置管理
美团Flume日志收集系统改进和优化
美团Flume日志收集系统架构和设计
美团数据仓库的演进
美团前端YUI3实践
Hadoop集群服务器cpu sys态异常的定位与解决
问题现象
- 在zabbix系统中,对Hadoop集群的历史监控数据分析时,发现在执行大Job任务时,某些服务节点的cpu sys态很高;
- 具体以hadoop_A服务节点为例,在10:15-10:40这个时间段,cpu user态为60%,而sys态则高达35%;
- 对于整个Hadoop集群,并不是所有的节点都会出现sys过高的问题,产生此类问题的都是部署CentOS6系统的节点。
定位分析
- 根据zabbix系统中cpu sys很高的问题发生时间,找到触发问题的大Job,以便于后面的问题重现和问题验证;
- 对问题节点hadoop_A的硬件信息和OS系统日志/var/log/messages进行初步检查,并未发现异常;
- 重启Job,重现问题。并使用nmon工具对问题节点hadoop_A的资源负载进行粗粒度的实时监测;hadoop_A节点上某一时刻瞬时的负载状态如下图:

- 通过上图,注意到网络流量达到了119.7MB/s,接收和发送的峰值都超过了120MB/s,初步怀疑网口在某一时间成为瓶颈,导致内核的sys过高。对hadoop_A的网口计数器细化分析,系统在uptime了83天的状态下,网口计数器中除overruns指标达22万之外,其他的网络指标正常。 这说明网络确实曾达到过峰值,也丢过包,但频率非常低,sys过高的问题应该不是网络负载过高触发。ifconfig查询网口的计数器状态如下图:

- 需要对系统进行更细粒度的分析,找出系统sys态消耗在什么地方。在hadoop_A节点上部署perf工具,通过perf top对kernel事件采样,实时分析内核事件。perf top在某一时刻的状态图如下:
通过perf top监控可以断定:kernel中存在频繁的spin_lock_irqsave内核系统调用, sys态消耗过高应该与此有关。 - 重启Job,再次重现问题,并利用perf工具对内核函数的调用关系采样:perf record -a -g -F 1000 sleep 30采样结束后,在当前目录上会生成一个perf.data文件,使用perf工具查看函数调用关系:perf report -gperf report查看到的调用关系如下图:

- 通过调用依赖关系分析,spin_lock_irqsave主要called by compaction_alloc,初步推测问题由kernel的内存管理部分触发。联想到centos 6相对于centos 5在kernel内存管理模块的一些改进点(如transparent huge page, 基于numa的内存分配等),有没有可能是CentOS6新增的THP特性导致cpu sys过高?再在google上搜一把相关函数名的关键字,印证这个猜测。
问题验证
- 选择在节点hadoop_A上面做验证测试,通过以下内核参数优化关闭系统THP特性:
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
- 重启触发问题的大Job,在hadoop_A节点未出现cpu sys 状态过高的现象。
- 在生产系统上运行24小时后,通过zabbix系统观察,其他内核未优化节点如hadoop_B,hadoop_C等节点依然存在cpu sys态过高的问题,而关闭了THP特性的hadoop_A节点没有出现cpu sys态过高的问题,验证了之前的分析。hadoop_B和hadoop_C依然存在cpu sys态过高的问题:
hadoop_A cpu sys态正常:
结论
将Hadoop集群中所有CentOS6类型节点的THP特性关闭掉(在CentOS6中,THP特性默认都是打开的),关闭方法如下:
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
值得注意的是,需要在puppet系统中部署该项优化,以免节点重启导致修改丢失。
参考
事后,在redhat官网和cloudera官网也搜到了相关的内容,附录下来,供参考。
- 在redhat的官网上,有对THP特性的细化说明:https://access.redhat.com/site/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Performance_Tuning_Guide/s-memory-transhuge.html
- 在cloudera的CDH4部署说明中,也建议将系统的THP的compaction特性关闭:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/4.2.2/CDH4-Installation-Guide/cdh4ig_topic_11_6.html
下一章:搜索引擎关键字智能提示的实现
问题背景搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户搜索体验。美团CRM系统中存在数以百万计的商家,为了让用户快速查找到目标商家,我们基于 ...
AI 中文社