linux命令行并发 linux内核中解决并发控制最常用的方法

在Linux系统中使用Shell实现多线程运行任务(多任务并发执行) 2022-05-30

最近,有一批任务需要把两批的fastq合并到一起并压缩成一个fastq文件才能继续往下做,由于存储空间有限又不能直接全部跑上,只能按样本逐个分批跑。众所周知,一般fastq是成对存在的,所需要对read1和read2分别合并一次,然而这次任务的fastq文件比较大,合并然后压缩一次需要1天左右,那对于一组fastq就要2-3天,这也太耗时间了,所以我在想能不能read1和read2 同时跑上,这就可以节省一半的时间了。

创新互联公司专注于安徽企业网站建设,成都响应式网站建设公司,商城网站开发。安徽网站建设公司,为安徽等地区提供建站服务。全流程定制网站设计,专业设计,全程项目跟踪,创新互联公司专业和态度为您提供的服务

平时也能遇到很多类似的任务,特别是在进程数有限的情况下,如果这些小任务单独占用一个进程,而任务很多就很耗时间,如果能在一个进程下实现多个线程并行执行,就能大大提高运行效率。关于进程和线程的知识可以参考知乎的这篇文章【 Shell“ 多线程”,提高工作效率 】,整理的也比较有条理,能比较容易读懂。

当然,某些博主也写过类似的文章,例如这篇【 shell后台限制多并发控制后台任务强度进行文件拷贝 】但是实在是太高深莫测了,看不懂,一时半会儿也学不会。本文将示例Shell实现多线程的简单版本,其实不用太复杂。

其实只需要两个步骤, 第一步是给需要并行运行的命令行在结尾加上"",代表放到后台运行,第二步是在在所有并行任务的后面加上一句“wait”,意思是等所有通过“”放到后台运行的任务跑完后再继续执行后面的任务 ,这些就能实现所有带有“”的行并行执行了。

看完脚本是不是觉得很简单?

上面的脚本适合并行任务少的,可以手动加和wait,但是如果有几十个甚至上百个的小任务就比较麻烦了。但不用担心,可以写个循环,批量运行。

循环的结果也是跟上面类似的,只是多了个循环结构。

如果需要执行的任务只有一行,可以把大括号去掉。

关于for和while的循环可以查看之前的文章【 Shell常用循环示例(for和while批量处理)2022-05-25 】

需要注意的是多线程并行还是需要有限制的,毕竟都是在一个进程里运行,如果线程太多了会卡顿的,建议控制在100个以内,当然还有毕竟高级和复杂的方法可以实现限制。因为上面的脚本已经够我用了,没继续往下学,以后可以再补充。

linux下并发连接数限制

并发socket连接数的多少决定于系统资源的多少,没有一个常值的.在实际开发或者linux系统管理中也会根据需要进行相应的设置.

1.一般来说每一个网络连接,都会建立相应的socket句柄,同时每个连接也会有标准输入输出等基本的文件文件句柄,而且每一个socket连接都是进行文件操作的,因此连接数决定于系统资源.

2.Linux上一般可以通过ulimit来进行相应的资源限制,默认能打开的文件描述符自己可以查看.如下图所示:

3.ulimit的命令格式:ulimit [-acdfHlmnpsStvw] [size]

参数说明:

-H 设置硬资源限制.

-S 设置软资源限制.

-a 显示当前所有的资源限制.

-c size:设置core文件的最大值.单位:blocks

-d size:设置数据段的最大值.单位:kbytes

-f size:设置创建文件的最大值.单位:blocks

-l size:设置在内存中锁定进程的最大值.单位:kbytes

-m size:设置可以使用的常驻内存的最大值.单位:kbytes

-n size:设置内核可以同时打开的文件描述符的最大值.单位:n

-p size:设置管道缓冲区的最大值.单位:kbytes

-s size:设置堆栈的最大值.单位:kbytes

-t size:设置CPU使用时间的最大上限.单位:seconds

-v size:设置虚拟内存的最大值.单位:kbytes

-u 程序数目  用户最多可开启的程序数目

Linux设备驱动中的并发

并发就是多个执行单元或多个进程并行执行,而这多个执行单元对资源进行共享,比如访问同一个变量或同一个硬件资源,这个时候就很容易出现竞态(说简单点就是竞争同一个”女朋友”)。

为了处理并发带来的问题,Linux有几种处理方法:

1. 中断屏蔽

2. 原子操作

3. 自旋锁

4. 信号量

5. 互斥体

6. 完成量

以上几种处理并发的方式各有利弊,需要根据实际情况来选择使用哪一种。

它的原理就是让CPU不响应中断,一般使用这种方法的要求代码段要比较少,不能占用大量的时间。一般在驱动中不推荐使用这种方式。

原子量保证对一个整形数据的操作是排他性的。就是该操作绝不会在执行完毕前被任何其他任务或事件打断。

自旋锁是一种典型的对临界资源进行互斥访问的手段。当一个自旋锁已经被其他线程持有,而另一个线程试图去获取自旋锁,这时候就会一直在那里等待(原地自旋等待)。如果递归调用自旋锁,就会导致系统死锁。

与自旋锁不同的是,当获取不到信号量时,进程不会原地打转而是进入休眠等待状态。新的Linux内核倾向于直接使用mutex作为互斥手段,信号量用作互斥不再被推荐使用。

当进程占用资源时间较长时,用互斥体会比较好。

使用方法:

完成量的机制是实现一个线程发送一个信号通知另一个线程完成某个任务。一个线程调用wait_for_completion后就进入休眠,另一个线程执行完某个任务后就发送通知给进入休眠的线程,然后它就执行wait_for_completion后面的代码。

2021-01-10:linux中,我要看某一个进程的并发,通过什么命令去查?

ps -axjf ,这个命令会打印进程树,不过看的是childID,类似的命令还有top -Hp pid,当然我理解的并发包括但不限于子进程

最详细的当然还是sudo perf top -p PID -g ,直接通过采样来看一个进程到底干了什么,期间有那些进程是active的,不止是子进程,还包括进程锁等相关进程,这大概是最符合你所说的看一个进程的并发的命令,希望对你有用吧。

linux内核中造成并发执行的原因是什么

linux中内核并发机制也就是同步机制产生的原因,总的来说可归纳为一下4点:

l 中断——中断几乎可以在任何时刻异步发生,也就可能随时打断当前正在执行的代码。

2 睡眠及与用户空间的同步——在内核执行的进程可能会睡眠,这就会唤醒调度程序,从而导致调度一个新的用户进程执行。

3 对称多处理——两个或多个处理器可以同时执行代码。

4内核抢占——因为内核具有抢占性,所以内核中的任务可能会被另一任务抢占(在2.6内核引进的新能力)。

Linux如何查看服务器的并发数

linux查看连接数,并发数1、查看apache当前并发访问数:

netstat

-an

grep

ESTABLISHED

wc

-l对比httpd.conf中MaxClients的数字差距多少。2、查看有多少个进程数:ps

auxgrep

httpdwc

-l3、可以使用如下参数查看数据server-status?auto#ps

-efgrep

httpdwc

-l1388统计httpd进程数,连个请求会启动一个进程,使用于Apache服务器。表示Apache能够处理1388个并发请求,这个值Apache可根据负载情况自动调整。#netstat

-natgrep

-i

80wc

-l4341netstat

-an会打印系统当前网络链接状态,而grep

-i

80是用来提取与80端口有关的连接的,wc

-l进行连接数统计。

最终返回的数字就是当前所有80端口的请求总数。#netstat

-nagrep

ESTABLISHEDwc

-l376netstat

-an会打印系统当前网络链接状态,而grep

ESTABLISHED

提取出已建立连接的信息。

然后wc

-l统计。最终返回的数字就是当前所有80端口的已建立连接的总数。netstat

-natgrep

ESTABLISHEDwc

-

可查看所有建立连接的详细记录

查看Apache的并发请求数及其TCP连接状态:linux命令:netstat

-n

awk

'/^tcp/

{++S[$NF]}

END

{for(a

in

S)

print

a,

S[a]}'返回结果示例:LAST_ACK

5SYN_RECV

30ESTABLISHED

1597FIN_WAIT1

51FIN_WAIT2

504TIME_WAIT

1057其中的SYN_RECV表示正在等待处理的请求数;ESTABLISHED表示正常数据传输状态;TIME_WAIT表示处理完毕,等待超时结束的请求数。(这个参数还不太懂,为啥是等待超时结束,请大神指教)


网页标题:linux命令行并发 linux内核中解决并发控制最常用的方法
当前URL:http://pcwzsj.com/article/dodipjp.html