BE崩溃后无法启动

BE崩溃后无法启动

为了更快的定位您的问题,请提供以下信息,谢谢

【详述】3个BE节点异常退出后,无法启动

【背景】

开发进行update全表一个字段值,导致三个BE均崩溃(进程退出)。对BE进行启动时,无法启动。

BE配置限制使用30G内存

mem_limit = 30G

以下时崩溃时,BE INFO的日志(详细查看附件)

image2536×1358 569 KB

以下是BE WARNING的日志(详细查看附件)

image2529×1376 576 KB

FE进程正常 BE启动几秒后提示killed(被内核OOM killed)

b57b29b168523b0395dc7decedf6133695×120 2.71 KB

启动BE时 out日志。

f4bcfb5d356b0c9dffbe8d7c39a50b91537×252 16.8 KB

启动BE前系统内存占用情况。

8bc734f6436b4e3bba113196ea31c81783×126 4.21 KB

linux内核有be的oom信息(be限制10G 和20G 都会有oom)

ed65da52b1e2689bad6d35b65b0f69c1611×464 39.3 KB

eced8480137e3255bb0c710227248922250×998 1.46 MB

BE配置

2357af422a8045cdbd83ce616b3dad8911×958 106 KB

FE配置

c1a2af6554819918b4ed998045516bf2042×1021 201 KB

【业务影响】影响所有涉及使用StarRocks系统(所有业务)。

【是否存算分离】否

【StarRocks版本】3.2.6

【集群规模】3fe(1 LEADER+2FOLLOWER)+3be(fe与be混部)

【机器信息】12C/38G/万兆

【联系方式】社区群17- Kay,谢谢

【附件】

fe.log/beINFO/相应截图 上面已提供

附件过大请在群内联系

慢查询:

Profile信息

并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;

pipeline是否开启:show variables like ‘%pipeline%’;

be节点cpu和内存使用率截图

查询报错:

query_dump,怎么获取query_dump文件

be crash

be.out

coredump,如何获取coredump

外表查询报错

be.out和fe.warn.log