调查androidlogcat进程退出原因

问题最终的logcat进程退出的原因是log buffer size设置过小导致,默认size为256KB,
将buffer size设置为4MB后,后面就再没有出现过logcat中断的情况;
修改的code就一行代码,但这个原因的调查过程确实不易,这里记录一二

1、测试同事在android 8.0平台版本中经常遇到logcat进程中途退出的情况,
导致抓的logcat信息不全,给分析定位问题带来不便;

2、基于出现的这种,进行分析logcat进程退出的可能性;
 一,在logcat进程中断时,监听logcat进程的程序显示exit code[1];
   有时候在cmd终端窗口显示"unexpected EOF",查看logcat.cpp相关code,
   看到是logcat进程的while循环中android_logger_list_read读取到的数据为0,
   logcat进程主动调用logcat_panic进程,logcat进程退出。
 
 二,然后尝试跟踪logcat进程读取数据的code流程,最终发现关联的内容蛮多的,
 有liblog、libsysutils、logd,主要是这三个模块;
 分析这类问题的最大难点是logcat进程退出时,是没有相关logcat信息的,很难看到问题原因,
 只能自己dup重定向标准输入输出或者将log打印kmsg模块中;
 最终根据添加的调试信息和打印log确认与buffer size有关;
     
  分析大致过程如下:
1、  在应用或者服务等进程 往logd中写入log量过大时(大于buffer size设置的2倍),
logd会调用kickMe函数,这里面会去判断stats size即系统中实际需要占用的大小,
当大于2倍我们在init函数中设定的默认buffer size(64KB)时,
Logd认为reader读取数据的速度过慢,会主动release_Locked函数尝试断开连接,
断开连接后会导致logd.reader.per线程while循环break退出;
Logd.cpp -> kickMe函数部分代码:
void LogBuffer::kickMe(LogTimeEntry* me, log_id_t id, unsigned long pruneRows) {
    if (stats.sizes(id) > (2 * log_buffer_size(id))) {  // +100%
        // A misbehaving or slow reader has its connection
        // dropped if we hit too much memory pressure.
        me->release_Locked();
        
2、logd.reader.per线程线程退出后,会调用SocketListener监听类的SocketListener::release,
logd开启的LogReader是继承自SocketListener,会调用到doSocketDelete,
SocketClient相关联的decRef函数,    
mRefCount—减值后会调用到~SocketClient析构函数,
析构后会调用close(mSocket) 关闭SocketListener端的socket连接,
 
 
3、socketListener的socket连接端开后,
LogReader中onDataAvailable中read函数读取不到数据,
返回值为0,LogReader是将log传递给logcat
bool LogReader::onDataAvailable(SocketClient* cli) {
    static bool name_set;
    if (!name_set) {
        prctl(PR_SET_NAME, "logd.reader");
        name_set = true;
    }
 
    char buffer[255];
 
    int len = read(cli->getSocket(), buffer, sizeof(buffer) - 1);
    if (len <= 0) {
         android::prdebug("LogReader->onDataAvailable ,length:%d !\n", len);
        doSocketDelete(cli);
        return false;
    }
 
4、接着会导致liblog模块的logdRead的recv函数返回值ret为0
(省略一部分transport相关过程,里面还有一些转化步骤),
static int logdRead(struct android_log_logger_list* logger_list,
  ret = recv(ret, log_msg, LOGGER_ENTRY_MAX_LEN, 0);
  e = errno;
  fprintf(stderr, "logdRead()-> receive  ret :%d  ^^^^^^^^^^^\n",ret);
 
 
5、导致最终Logcat端进程的while循环中android_logger_list_read读取到的数据为0,
logcat进程主动调用logcat_panic进程,logcat进程退出。
    while (!context->stop &&
           (!context->maxCount || (context->printCount < context->maxCount))) {
        struct log_msg log_msg;
        int ret = android_logger_list_read(logger_list, &log_msg);
        if (!ret) {
              fprintf(stderr, "android_logger_list_read error ,ret:%d !\n", ret);
            logcat_panic(context, HELP_FALSE, "read: unexpected EOF!\n");
            break;
        }

分享名称:调查androidlogcat进程退出原因
标题来源:http://pcwzsj.com/article/ijjjpd.html