最近看了一下Linux Poll 機制的實現,看了韋老師的分析文檔,總結如下:
int poll(struct pollfd *fds,nfds_t nfds, int timeout);
總的來說,Poll機制會判斷fds中的文件是否可讀,如果可讀則會立即返回,返回的值就是可讀fd的數量,如果不可讀,那么就進程就會休眠timeout這么長的時間,然后再來判斷是否有文件可讀,如果有,返回fd的數量,如果沒有,則返回0. ?
在內核中大致上實現過程:
當應用程序調用poll函數的時候,會調用到系統調用sys_poll函數,該函數最終調用do_poll函數,do_poll函數中有一個死循 環,在里面又會利用do_pollfd函數去調用驅動中的poll函數(fds中每個成員的字符驅動程序都會被掃描到),驅動程序中的Poll函數的工作 有兩個,一個就是調用poll_wait 函數,把進程掛到等待隊列中去(這個是必須的,你要睡眠,必須要在一個等待隊列上面,否則到哪里去喚醒你呢??),另一個是確定相關的fd是否有內容可 讀,如果可讀,就返回1,否則返回0,如果返回1 ,do_poll函數中的count++, ?? 然后? do_poll函數然后判斷三個條件(if (count ||!timeout || signal_pending(current)))如果成立就直接跳出,如果不成立,就睡眠timeout個jiffes這么長的時間(調用schedule_timeout實現睡眠),如果在這段時間內沒有其他進程去喚醒它,那么第二次執行判斷的時候就會跳出死循環。如果在這段時間內有其他進程喚醒它,那么也可以跳出死循環返回(例如我們可以利用中斷處理函數去喚醒它,這樣的話一有數據可讀,就可以讓它立即返回)。
poll機制分析
韋東山2009.12.10
所有的系統調用,基于都可以在它的名字前加上“sys_”前綴,這就是它在內核中對應的函數。pow和pos機制?比如系統調用open、read、write、poll,與之對應的內核函數為:sys_open、sys_read、sys_write、sys_poll。
?
一、內核框架:
對于系統調用poll或select,它們對應的內核函數都是sys_poll。分析sys_poll,即可理解poll機制。pos pow 機制,
1.??????sys_poll函數位于fs/select.c文件中,代碼如下:
asmlinkagelong sys_poll(struct pollfd __user *ufds, unsigned int nfds,
???????????????? long timeout_msecs)
{
???????? s64 timeout_jiffies;
?
???????? if (timeout_msecs > 0) {
#ifHZ > 1000
???????????? /* We can only overflow if HZ >1000 */
???????????? if (timeout_msecs / 1000 >(s64)0x7fffffffffffffffULL / (s64)HZ)
???????????????? timeout_jiffies = -1;
???????????? else
#endif
???????????????? timeout_jiffies =msecs_to_jiffies(timeout_msecs);
???????? } else {
???????????? /* Infinite (< 0) or no (0)timeout */
???????????? timeout_jiffies = timeout_msecs;
???????? }
?
???????? return do_sys_poll(ufds,nfds, &timeout_jiffies);
}
它對超時參數稍作處理后,直接調用do_sys_poll。
?
2.??????do_sys_poll函數也位于位于fs/select.c文件中,我們忽略其他代碼:
intdo_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)
{
……
poll_initwait(&table);
……
???????? fdcount = do_poll(nfds, head,&table, timeout);
……
}
?
poll_initwait函數非常簡單,它初始化一個poll_wqueues變量table:
poll_initwait> init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;
即table->pt->qproc= __pollwait,__pollwait將在驅動的poll函數里用到。
?
?
3.??????do_sys_poll函數位于fs/select.c文件中,代碼如下:
?
static int do_poll(unsigned int nfds,? struct poll_list *list,
???????? ?? struct poll_wqueues *wait, s64 *timeout)
{
01 ……
02 ? for (;;){
03 ……
04 ????????????????? if(do_pollfd(pfd, pt)) {
05?????????????????????????? count++;
06?????????????????????????? pt = NULL;
07?????????????????? }
08 ……
09?????? if(count || !*timeout || signal_pending(current))
10?????????? break;
11?????? count= wait->error;
12?????? if(count)
13?????????? break;
14
15?????? if(*timeout < 0) {
16?????????? /*Wait indefinitely */
17?????????? __timeout= MAX_SCHEDULE_TIMEOUT;
18?????? }else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {
19?????????? /*
20?????????? * Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in
21?????????? * a loop
22?????????? */
23?????????? __timeout= MAX_SCHEDULE_TIMEOUT - 1;
24?????????? *timeout-= __timeout;
25?????? }else {
26?????????? __timeout= *timeout;
27?????????? *timeout= 0;
28?????? }
29
30?????? __timeout= schedule_timeout(__timeout); // 休眠時間由應用提供
31?????? if(*timeout >= 0)
32?????????? *timeout+= __timeout;
33?? }
34?? __set_current_state(TASK_RUNNING);
35?? returncount;
36 }
?
分析其中的代碼,可以發現,它的作用如下:
①????從02行可以知道,這是個循環,它退出的條件為:
a.??????09行的3個條件之一(count非0,超時、有信號等待處理)
count順0表示04行的do_pollfd至少有一個成功。poll中文意思、
b.??????11、12行:發生錯誤
②????重點在do_pollfd函數,后面再分析
③????第30行,讓本進程休眠一段時間,注意:應用程序執行poll調用后,如果①②的條件不滿足,進程就會進入休眠。那么,誰喚醒呢?除了休眠到指定時間被系統喚醒外,還可以被驅動程序喚醒──記住這點,這就是為什么驅動的poll里要調用poll_wait的原因,后面分析。
?
4.??????do_pollfd函數位于fs/select.c文件中,代碼如下:
static inline unsigned int do_pollfd(struct pollfd*pollfd, poll_table *pwait)
{
……
???????????? if(file->f_op && file->f_op->poll)
???????????????????? mask= file->f_op->poll(file, pwait);
……
}
?
可見,它就是調用我們的驅動程序里注冊的poll函數。polling模式,
?
二、驅動程序:
驅動程序里與poll相關的地方有兩處:一是構造file_operation結構時,要定義自己的poll函數。二是通過poll_wait來調用上面說到的__pollwait函數,pollwait的代碼如下:
staticinline void poll_wait(struct file * filp, wait_queue_head_t * wait_address,poll_table *p)
{
???????? if (p && wait_address)
???????????? p->qproc(filp, wait_address, p);
}
p->qproc就是__pollwait函數,從它的代碼可知,它只是把當前進程掛入我們驅動程序里定義的一個隊列里而已。它的代碼如下:
staticvoid __pollwait(struct file *filp, wait_queue_head_t *wait_address,
???????????????????????? poll_table *p)
{
???????? struct poll_table_entry *entry =poll_get_entry(p);
???????? if (!entry)
???????????? return;
???????? get_file(filp);
???????? entry->filp = filp;
???????? entry->wait_address = wait_address;
???????? init_waitqueue_entry(&entry->wait,current);
???????? add_wait_queue(wait_address,&entry->wait);
}
?
執行到驅動程序的poll_wait函數時,進程并沒有休眠,我們的驅動程序里實現的poll函數是不會引起休眠的。讓進程進入休眠,是前面分析的do_sys_poll函數的30行“__timeout = schedule_timeout(__timeout)”。
poll_wait只是把本進程掛入某個隊列,應用程序調用poll > sys_poll> do_sys_poll > poll_initwait,do_poll > do_pollfd > 我們自己寫的poll函數后,再調用schedule_timeout進入休眠。如果我們的驅動程序發現情況就緒,可以把這個隊列上掛著的進程喚醒。可見,poll_wait的作用,只是為了讓驅動程序能找到要喚醒的進程。即使不用poll_wait,我們的程序也有機會被喚醒:chedule_timeout(__timeout),只是休眠__time_out這段時間。
?
現在來總結一下poll機制:
1. poll > sys_poll > do_sys_poll >poll_initwait,poll_initwait函數注冊一下回調函數__pollwait,它就是我們的驅動程序執行poll_wait時,真正被調用的函數。
?
2. 接下來執行file->f_op->poll,即我們驅動程序里自己實現的poll函數
?? 它會調用poll_wait把自己掛入某個隊列,這個隊列也是我們的驅動自己定義的;
?? 它還判斷一下設備是否就緒。
?
3. 如果設備未就緒,do_sys_poll里會讓進程休眠一定時間,這個時間是應用提供的“超時時間”
?
4. 進程被喚醒的條件有2:一是上面說的“一定時間”到了,二是被驅動程序喚醒。驅動程序發現條件就緒時,就把“某個隊列”上掛著的進程喚醒,這個隊列,就是前面通過poll_wait把本進程掛過去的隊列。
?
5. 如果驅動程序沒有去喚醒進程,那么chedule_timeout(__timeou)超時后,會重復2、3動作1次,直到應用程序的poll調用傳入的時間到達, 然后返回。