發表文章

目前顯示的是 三月, 2013的文章

mmap

下面是一個很簡單、很一般的程式碼,內容是使用 openssl 所提供的函式去計算一個檔案的 MD5。既然這麼簡單為什麼要紀錄呢?理由有兩個:第一,紀錄一下要怎麼使用 openssl 的 library;第二是今天的重點,mmap。

一般來說,要計算一個檔案的 MD5,勢必要把整個檔案讀到記憶體當中(或是分批讀入,但勢必整個檔案都要吃進來),所以標準的程序應該是 open --> read --> md5 --> close。而在 read 這一步還需要額外準備一份記憶體空間給它。但如果使用 mmap 的話就可以直接少了 read 這一步了。


#include<stdio.h> #include<stdlib.h> #include<string.h> #include<unistd.h> #include<fcntl.h> #include<sys/mman.h> #include<sys/types.h> #include<sys/stat.h> #include<openssl/md5.h>longutil_getFileSize( char * ); voidutil_md5File( char *, unsigned char * ); static longutil_getFdSize( int ); intmain( int argc, char *argv[] ) { int fileFd = 0; long fileSize = 0; unsigned char md5sum[MD5_DIGEST_LENGTH]; int i = 0; if( argc != 2 ) { printf( "Usage: md5 <file>\n" ); return 0; } fileSize = util_getFileSize( argv[1] ); if( fi…

memcpy vs. memmove

這個事件是在工作中時間發生的案例。先看看下面的例子:

#include <stdio.h>#include <stdlib.h>#include <string.h>intmain() { int a[100]; int i = 0; int index = 5; for( i = 0 ; i < 100 ; i++ ) { a[i] = i; } memcpy( &(a[index]), &(a[(index + 1)]), sizeof( int ) * ( 100 - index - 1 ) ); for( i = 0 ; i < 100 ; i++ ) { printf( "%d", a[i] ); if( ( i % 10 ) == 9 ) { printf( "\n" ); } } printf( "\n" ); return 0; }
好了,請問上面這段程式碼在寫什麼呢?

其實很簡單,這只是一個 array shift 的動作,將 index 後面的元素全部往前搬動一格。這樣寫會有什麼問題呢?我在我自己的電腦上什麼問題都沒有發生啊?

邏輯上很 OK ,但問題出在 memcpy 這隻函式上面。一般人可能會認為, memcpy 是直接做 sequential 的拷貝動作,也就是程式會先把把 i+1 的元素拷貝到 i ,然後才會把 i+2 的元素拷貝到 i+1。很直覺,但是上面這個想法是誰說的?

來讀讀看 manual 吧!

The memcpy() function copies n bytes from memory area src to memory area dest.  The memory areas must not overlap.

換句話說,

If copying takes place between objects that overlap, th…