python线程池

线程池的概念简单理解就是很多线程的列表,一般线程池和任务队列相结合。一个任务队列是FIFO的,主线程负责所有进程的管理,生成一个子线程(一个子进程或者线程池)对队列进行任务输入,任务的输出端可以是线程池。由主线程进行调度,根据线程ID分配任务。

下面是python的代码

# !/usr/bin/env python
# -*- coding:utf-8 -*-
# ref_blog:http://www.open-open.com/home/space-5679-do-blog-id-3247.html

import Queue
import threading
import time

class WorkManager(object):
    def __init__(self, work_num=1000,thread_num=2):
        self.work_queue = Queue.Queue()
        self.threads = []
        self.__init_work_queue(work_num)
        self.__init_thread_pool(thread_num)

    """
        初始化线程
    """
    def __init_thread_pool(self,thread_num):
        for i in range(thread_num):
            self.threads.append(Work(self.work_queue))

    """
        初始化工作队列
    """
    def __init_work_queue(self, jobs_num):
        for i in range(jobs_num):
            self.add_job(do_job, i)

    """
        添加一项工作入队
    """
    def add_job(self, func, *args):
        self.work_queue.put((func, list(args)))#任务入队,Queue内部实现了同步机制
    """
        检查剩余队列任务
    """
    def check_queue(self):
        return self.work_queue.qsize()

    """
        等待所有线程运行完毕
    """
    def wait_allcomplete(self):
        for item in self.threads:
            if item.isAlive():item.join()

class Work(threading.Thread):
    def __init__(self, work_queue):
        threading.Thread.__init__(self)
        self.work_queue = work_queue
        self.start()

    def run(self):
        #死循环,从而让创建的线程在一定条件下关闭退出
        while True:
            try:
                do, args = self.work_queue.get(block=False)#任务异步出队,Queue内部实现了同步机制
                do(args)
                self.work_queue.task_done()#通知系统任务完成
            except Exception,e:
                print str(e)
                break

#具体要做的任务
def do_job(args):
    print args
    time.sleep(0.1)#模拟处理时间
    print threading.current_thread(), list(args)

if __name__ == '__main__':
    start = time.time()
    work_manager =  WorkManager(10, 2)#或者work_manager =  WorkManager(10000, 20)
    work_manager.wait_allcomplete()
    end = time.time()
    print "cost all time: %s" % (end-start)

这段代码比较清楚,逻辑也简单,不过这里有几个要注意的地方: 1.thread的join()函数,join()能够使得调用线程等待子线程执行完毕,一旦调用了join(),调用线程就阻塞了,直到子线程完毕继续执行接下来的代码。当然 join() 可以加参数来限制等待的时间。看一段代码

import threading
import random
import time

class MyThread(threading.Thread):

    def run(self):
        wait_time=random.randrange(1,10)
        print "%s will wait %d seconds" % (self.name, wait_time)
        time.sleep(wait_time)
        print "%s finished!" % self.name

if __name__=="__main__":
    threads = []
    for i in range(2):
        t = MyThread()
        t.start()
        threads.append(t)
    print 'main thread is waitting for exit...'
    k = 0
    for t in threads:
        print k
        k += 1
        t.join()

    print 'main thread finished!'

执行的时候会发现,jion()就会阻塞在第一个线程,k的值只打印了一个0,后面的代码等第一个子线程执行完才继续了。换句话说,如果调用线程对所有子线程都进行 join() 操作,那么只要有一个子线程没有执行完成,那么调用线程就阻塞。

  1. Queue的队列操作是不需要加文件锁的,这里Queue已经有内置的变量同步机制了。

  2. Queue的 get() 方法,可以加参数 get(block=False) 那么获取线程就不会阻塞,默认则是阻塞。

标签:none