www.日本精品,久久中文视频,中文字幕第一页在线播放,香蕉视频免费网站,老湿机一区午夜精品免费福利,91久久综合精品国产丝袜长腿,欧美日韩视频精品一区二区

Q格式運算講解學習

發(fā)布時間:2020-10-05 來源: 演講稿 點擊:

 ·37·

  第3章 DSP 芯片的定點運算

 3.1 數 的 定 標 在定點 DSP芯片中,采用定點數進行數值運算,其操作數一般采用整型數來表示。一 個整型數的最大表示范圍取決于 DSP芯片所給定的字長,一般為 16位或 24位。顯然,字長越長,所能表示的數的范圍越大,精度也越高。如無特別說明,本書均以 16位字長為例。

 DSP芯片的數以 2的補碼形式表示。每個 16位數用一個符號位來表示數的正負, 0表示數值為正,

 1則表示數值為負。其余 15位表示數值的大小。因此 二進制數 0010000000000011b = 8195 二進制數 1111111111111100b = - 4 對 DSP 芯片而言,參與數值運算的數就是 16 位的整型數。但在許多情況下,數學運算 過程中的數不一定都是整數。那么, DSP芯片是如何處理小數的呢?應該說, DSP芯片本身無能為力。那么是不是說 DSP芯片就不能處理各種小數呢?當然不是。這其中的關鍵就 是由程序員來確定一個數的小數點處于 16位中的哪一位。這就是數的定標。

 通過設定小數點在 16位數中的不同位置,就可以表示不同大小和不同精度的小數了。

 數的定標有 Q表示法和

 S表示法兩種。表 3.1列出了一個 16 位數的 16種Q表示、 S表示及它們所能表示的十進制數值范圍。

 從表 3.1可以看出,同樣一個 16位數,若小數點設定的位置不同,它所表示的數也就不 同。例如:

 16進制數 2000H = 8192,用 Q0表示 16進制數 2000H = 0.25,用 Q15表示 但對于 DSP芯片來說,處理方法是完全相同的。

 從表 3.1還可以看出,不同的 Q所表示的數不僅范圍不同,而且精度也不相同。

 Q越大,數值范圍越小,但精度越高;相反, Q越小,數值范圍越大,但精度就越低。例如, Q0的數值范圍是 - 32768到+32767 ,其精度為 1,而 Q15 的數值范圍為 - 1 到0.9999695,精度為 1/32768 = 0.00003051 。因此,對定點數而言,數值范圍與精度是一對矛盾,一個變量 要想能夠表示比較大的數值范圍,必須以犧牲精度為代價;而想提高精度,則數的表示范圍就相應地減小。在實際的定點算法中,為了達到最佳的性能,必須充分考慮到這一點。

 · 38·

。 16384/32768=0.5 。

 16384 ,式中 16384 × 2- 15 浮點數與定點數的轉換關系可表示為:

 浮點數 (x) 轉換為定點數 ( x ):

 x (int) x q q 2Q 定點數 ( x q

 )轉換為浮點數 (x) :

 x ( float )x q

 2 Q 例如,浮 點數 x=0.5 , 定 標 Q = 15 , 則定 點數 Q= 15 表示的定點數 x q

 = 0.5 32768 表示下取整。反之,一個用 16384 ,其浮點數為

 ·39·

  表3.1 Q表示、 S表示及數值范圍 Q表示 S表示 十進制數表示范圍 Q15 S0.15 - 1≤ X≤ 0.9999695 Q14 S1.14 - 2≤ X≤ 1.9999390 Q13 S2.13 - 4≤ X≤ 3.9998779 Q12 S3.12 - 8≤ X≤ 7.9997559 Q11 S4.11 - 16≤ X≤ 15.9995117 Q10 S5.10 - 32≤ X≤ 31.9990234 Q9 S6.9 - 64≤ X≤ 63.9980469 Q8 S7.8 - 128≤ X≤ 127.9960938 Q7 S8.7 - 256≤ X≤ 255.9921875 Q6 S9.6 - 512≤ X≤ 511.9804375 Q5 S10.5 - 1024≤ X ≤ 1023.96875 Q4 S11.4 - 2048≤X ≤ 2047.9375 Q3 S12.3 - 4096≤ X≤ 4095.875 Q2 S13.2 - 8192≤ X≤ 8191.75 Q1 S14.1 - 16384≤ X ≤16383.5 Q0 S15.0 - 32768≤ X ≤ 32767

  3.2 高級語言:從浮點到定點 在編寫

 DSP模擬算法時,為了方便,一般都是采用高級語言

 (如 C語言 )來編寫模擬程序。程序中所用的變量一般既有整型數,又有浮點數。如例 3.1程序中的變量 i是整型數, 而pi是浮點數, hamwindow 則是浮點數組。

 例 3.1 256點漢明窗計算int

 i; float pi=3.14159; float hamwindow[256]; for(i=0;i<256;i++) hamwindow[i]=0.54 - 0.46*cos(2.0*pi*i/255); 如果要將上述程序用某種定點 DSP芯片來實現,則需將上述程序改寫為 DSP芯片的匯編語言程序。為了 DSP 程序調試的方便及模擬定點 DSP實現時的算法性能,在編寫 DSP匯編程序之前 一般需將高級語言浮點算法改寫為高級語言定點算法 。下面討論基本算術運算

 · 40·

 的定點實現方法。

 3.2.1 加法/減法運算的 C語言定點模擬 設浮點加法運算的表達式為:

 float x,y,z;

 ·41·

 q q z=x+y; 將浮點加法 /減法轉化為定點加法 /減法時 最重要的一點就是必須保證兩個操作數的定標值一

 樣。

 若兩者不一樣,則在做加法

 /減法運算前先進行小數點的調整。為保證運算精 度, 需使 Q 值小的數調整為與另一個數的 Q 值一樣大

 。此外,在做加法 /減法運算時,必須 注意結果可能會超過 16位表示。

 如果加法

 /減法的結果超出 16位的表示范圍,則必須保留 32 位結果,以保證運算的精度 。

 1. 結果不超過 16位表示范圍 設 x的Q值為Qx, y的 Q值為 Qy,且Qx>Qy ,加法 / 減法結果 z的定標值為 Qz,則 z= x+y z q

 2

 Q z

 x q

 2

 Q x

 Q y q

 2 = x q

 2 Q x

 y 2(Q x

 Q y ) 2 Q x

 = [ x q

 y q

 2(Q x

 Q y

 ) ]

 2 Q x

 z q [ xq

 y 2(Q x

 Q y ) ]

 2( Qz

 Q x )

 所以定點加法可以描述為:

 int x,y,z; long temp; /* 臨時變量 */ temp= y<<(Qx - Qy); temp= x+ temp; z= (int)(temp>>(Qx - Qz)), 若Qx≥ Qz z= (int)(temp<<(Qz - Qx)), 若QxQ ≤ z 例 3.2 定點加法 設x= 0.5, y=3.1,則浮點運算結果為 z= x+y = 0.5+3.1 = 3.6; Qx= 15, Qy=13, Qz= 13,則定點加法為:

 x= 16384; y=25395; temp= 25395<<2 = 101580; temp= x+temp = 16384+101580 = y

 · 42·

 117964; z= (int)(117964L>>2) = 29491; 因為 z的Q值為 13,所以定點值 z= 29491即為浮點值 z= 29491/8192 =3.6。

 例 3.3 定點減法 設x= 3.0, y=3.1,則浮點運算結果為 z= x- y= 3.0- 3.1= - 0.1; Qx= 13, Qy=13, Qz= 15,則定點減法為:

 x= 24576; y=25295; temp= 25395; temp= x- temp= 24576- 25395= - 819; 因為 Qx<Qz ,故 z= (int)( - 819<<2) = - 3276 。由于 z的 Q值為 15,所以定點值 z= - 3276即為浮點值 z= - 3276/32768 - 0.1。

 2. 結果超過 16位表示范圍

 ·43·

 設 x的Q值為Qx, y的 Q值為 Qy,且Qx>Qy ,加法結果 z的定標值為 Qz,則定點加法為:

 int x , y; long temp, z; temp= y<<(Qx - Qy) ; temp= x+ temp; z= temp>>(Qx - Qz),若Qx ≥ Qz z= temp<<(Qz - Qx) ,若Qx ≤ Qz 例 3.4 結果超過 16位的定點加法 設x= 15000, y= 20000,則浮點運算值為 z= x+ y= 35000,顯然 z>32767 ,因此Qx= 1, Qy= 0, Qz= 0,則定點加法為:

 x= 30000; y=20000; temp= 20000<<1 = 40000; temp= temp+x =40000+30000 = 70000; z= 70000L>>1 = 35000; 因為 z的Q值為 0,所以定點值 z=35000就是浮點值,這里 z是一個長整型數。

 當加法或加法的結果超過 16位表示范圍時,如果程序員事先能夠了解到這種情況,并 且需要保證運算精度時,則必須保持 32位結果。如果程序中是按照 16位數進行運算的,則超過 16位實際上就是出現了溢出。如果不采取適當的措施,則數據溢出會導致運算精度的 嚴重惡化。一般的定點 DSP芯片都設有溢出保護功能,當溢出保護功能有效時,一旦出現 溢出,則累加器 ACC 的結果為最大的飽和值 (上溢為 7FFFH ,下溢為 8001H) ,從而達到防止溢出引起精度嚴重惡化的目的。

 3.2.2 乘法運算的 C語言定點模擬 設浮點乘法運算的表達式為:

 float x,y,z; z = xy; 假設經過統計后 x的定標值為 Qx, y的定標值為 Qy ,乘積 z的定標值為 Qz,則 z = xy z q

 2 z = x q

 y q

 2 (Q x Q y ) Q z = ( x y )2 z ( Q x

 Q y

 ) q q q

 所以定點表示的乘法為:

 int x,y,z; Q

 · 44·

 long temp; temp = (long)x; z = (temp× y) >> (Qx+Qy - Qz); 例 3.5 定點乘法 設x = 18.4 , y = 36.8 ,則浮點運算值為 z =18.4× 36.8 = 677.12; 根據上節(jié),得 Qx = 10 , Qy = 9 , Qz = 5 ,所以

 ·45·

 Q Q x = 18841 ; y = 18841 ; temp = 18841L; z = (18841L*18841)>>(10+9 - 5) = 354983281L>>14 = 21666; 因為 z的定標值為

 5,故定點 z = 21666 即為浮點的 z = 21666/32 = 677.08 。

 3.2.3 除法運算的 C語言定點模擬 設浮點除法運算的表達式為:

 float x,y,z; z = x/y; 假設經過統計后被除數 x的定標值為 Qx,除數 y的定標值為 Qy,商 z的定標值為 Qz,則 z = x/y

 z q

 2 z = x q

 2 x Q y

 y q

 2

 x q

 2 z q

 (Q z

 Q x

  y q

 Q y

 )

 所以定點表示的除法為:

 int x,y,z; long temp; temp = (long)x; z = (temp<<(Qz - Qx+Qy))/y; 例 3.6 定點除法 設x = 18.4 , y = 36.8 ,浮點運算值為 z = x/y = 18.4/36.8 = 0.5; 根據上節(jié),得 Qx = 10 , Qy = 9 , Qz = 15 ;所以有x = 18841, y = 18841; temp = (long)18841; z = (18841L<<(15 - 10+9))/18841 = 308690944L/18841 = 16384; 因為商 z的定標值為

 15,所以定點

 z = 16384即為浮點 z = 16384/2 15 = 0.5。

 3.2.4 程序變量的 Q值確定

 · 46·

 在前面幾節(jié)介紹的例子中,由于 x、y、z的值都是已知的,因此從浮點變?yōu)槎c時 Q值很好確定。在實際的 DSP應用中,程序中參與運算的都是變量,那么如何確定浮點程序中 變量的 Q值呢? 從前面的分析可以知道,確定變量的 Q值實際上就是確定變量的動態(tài)范圍,動態(tài)范圍確定了,則 Q值也就確定了。

 設變量的絕對值的最大值為 max , 注意 max 必須小于或等于 32767。取一個整數 n, 使它滿足 2n 1 則有 max 2n

 ·47·

 ,則 2 Q 2 15 2 n 2 (15 n) Q = 15 - n 例如,某變量的值在 - 1至+ 1之間,即 max <1,因此 n = 0, Q= 15- n = 15。

 確定了變量的 max 就可以確定其 Q值,那么變量的 max 又是如何確定的呢?一般來說,確定變量的 max 有兩種方法:一種是理論分析法,另一種是統計分析法。

 1. 理論分析法 有些變量的動態(tài)范圍通過理論分析是可以確定的。例如:

 (1)

 三角函數,

 y = sin(x)或y = cos( x),由三角函數知識可知, |y|≤ 1; (2)

 漢明窗,

 y( n)

 = 0.54- 0.46cos [2 n/(N - 1)] , 0≤ n≤ N- 1。因為 - 1≤ cos [2 n/(N - 1)] ≤ 1,所以 0.08≤ y(n)≤ 1.0; N (3) FIR卷積。

 y(n)= k 1 h( k) x( n 0 k ) ,設 N 1 h( k) k 0 1.0 ,且 x( n)是模擬信號 12位量化值, 即有 x(n) 11 y( n) ≤2 11 ;

 (4) 理論已經證明,在自相關線性預測編碼 (LPC) 的程序設計中,反射系數不等式:

 k i 滿足下列 k i

 1.0 , i= 1,2, ,p, p為LPC 的階數。

 2. 統計分析法 對于理論上無法確定范圍的變量,一般采用統計分析的方法來確定其動態(tài)范圍。所謂統計分析,就是用足夠多的輸入信號樣值來確定程序中變量的動態(tài)范圍,這里輸入信號一方面要有一定的數量,另一方面必須盡可能地涉及各種情況。例如,在語音信號分析中, 統計分析時就必須采集足夠多的語音信號樣值,并且在所采集的語音樣值中,應盡可能地 包含各種情況,如音量的大小、聲音的種類

  (男聲、女聲

 )

 等。只有這樣,統計出來的結果才能具有典型性。

 當然,統計分析畢竟不可能涉及所有可能發(fā)生的情況,因此,對統計得出的結果在程 序設計時可采取一些保護措施,如適當犧牲一些精度, Q值取比統計值稍大些,使用 DSP 芯片提供的溢出保護功能等。

 3.2.5 浮點至定點變換的 C程序舉例 本節(jié)通過一個例子來說明 C 程序從浮點變換至定點的方法。這是一個對語音信號(0.3kHz~3.4kHz) 進行低通濾波的

 C語言程序,低通濾波的截止頻率為 800Hz ,濾波器采用 19 點的有限沖擊響應 FIR濾波。語音信號的采樣頻率為 8kHz ,每個語音樣值按 16位整型數存≤ 2

 · 48·

 放在 insp.dat文件中。

 例 3.7 語音信號 800Hz 19 點FIR低通濾波 C語言浮點程序#include <stdio.h> const int length = 180 /* 語音幀長為 180點= 22.5ms@8kHz 采樣 */ void filter(int xin[ ],int xout[ ],int n,float h[ ]); /* 濾波子程序說明 */ /*19 點濾波器系數 */ static float h[19]=

 ·49·

 {0.01218354, - 0.009012882,- 0.02881839,- 0.04743239, - 0.04584568, - 0.008692503,0.06446265,0.1544655,0.2289794,0.257883, 0.2289794,0.1544655,0.06446265, - 0.008692503,- 0.04584568, - 0.04743239, - 0.02881839,- 0.009012882,0.01218354}; static int x1[length+20]; /* 低通濾波浮點子程序 */ void filter(int xin[ ],int xout[ ],int n,float h[ ]) { int i,j; float sum; for(i=0;i<length;i++) x1[n+i-1]=xin[i]; for (i=0;i<length;i++) { sum=0.0; for(j=0;j<n;j++) sum+=h[j]*x1[i - j+n - 1]; xout[i]=(int)sum; } for(i=0;i<(n - 1);i++) x1[n - i - 2]=xin[length - 1- i]; }

  /* 主 程 序 */ void main( ) { FILE *fp1,*fp2; int frame,indata[length],outdata[length]; fp1=fopen(insp.dat,"rb"); /* 輸入語音文件 */

 · 50·

 fp2=fopen(outsp.dat,"wb");

 frame=0; /* 濾波后語音文件 */ while(feof(fp1)==0)

  {

  frame++;

  printf("frame=%d\n",frame);

  for(i=0;i<length;i++) indata[i]=getw(fp1); /* 取一幀語音數據 */ filter(indata,outdata,19,h); /* 調用低通濾波子程序 */ for(i=0;i<length;i++) putw(outdata[i],fp2); /* 將濾波后的樣值寫入文件 */ }

  fcloseall( );

 /* 關閉文件 */ return(0);

 ·51·

 } 例 3.8 語音信號 800Hz 19 點FIR低通濾波 C語言定點程序#include <stdio.h> const int length=180; void filter(int xin[ ],int xout[ ],int n,int h[ ]); static int h[19]={399, - 296,- 945,- 1555, - 1503,- 285,2112,5061,7503,8450, 7503,5061,2112, - 285,- 1503,- 1555, - 945,- 296,399}; /*Q15*/ static int x1[length+20]; /* 低通濾波定點子程序 */ void filter(int xin[ ],int xout[ ],int n,int h[ ]) { int i,j; long sum; for(i=0;i<length;i++) x1[n+i - 1]=xin[i]; for (i=0;i<length;i++) { sum=0; for(j=0;j<n;j++) sum+=(long)h[j]*x1[i - j+n - 1]; xout[i]=sum>>15; } for(i=0;i<(n - 1);i++) x1[n - i- 2]=xin[length - i- 1]; } 主程序與浮點的完全一樣。

 3.3 DSP定點算術運算 定點 DSP芯片的數值表示是基于 2的補碼表示形式。每個 16位數用 1個符號位、 i個整數 位和 15- i 個小數位來表示。因此數 00000010.10100000 表示的值為 2 1 2 1

 2 3

 =2.625 , 這 個數可用

 Q8格式 (8個小數位 )來表示,它表示的數值范圍為 - 128~+127.996 ,一個 Q8 定點數的小數精度為 1/256=0.004 。

 · 52·

 雖然特殊情況 ( 如動態(tài)范圍和精度要求 )必須使用混合表示法,但是,更通常的是全部以Q15格式表示的小數或以 Q0格式表示的整數來工作。這一點對于主要是乘法和累加的信號處理算法特別現實,小數乘以小數得小數,整數乘以整數得整數。當然,乘積累加時可 能會出現溢出現象,在這種情況下,程序員應當了解數學里面的物理過程以注意可能的溢 出情況。下面討論乘法、加法和除法的 DSP定點運算,匯編程序以 TMS320C25 為例。

 3.3.1 定點乘法 2個定點數相乘時可以分為下列 3種情況:

 1. 小數乘小數

 ·53·

 Q15× Q15= Q30

 例 3.9 0.5*0.5 = 0.25 0.100000000000000 ; Q15 × 0.100000000000000 ; Q15 00.010000000000000000000000000000=0.25 ; Q30 2個Q15的小數相乘后得到 1個Q30的小數,即有 2個符號位。一般情況下相乘后得到的 滿精度數不必全部保留,而只需保留 16位單精度數。由于相乘后得到的高 16位不滿

  15位的小數精度,為了達到 15位精度,可將乘積左移 1位,下面是上述乘法的 TMS320C25 程序 :

 LT OP1 ; OP1=4000H(0.5/Q15) MPY PAC OP2 ; OP2=4000H(0.5/Q15) SACH ANS,1 ; ANS=2000H(0.25/Q15) 2. 整數乘整數 Q0× Q0 = Q0

 例 3.10 17× (- 5)= - 85

 0000000000010001=17 × 1111111111111011= - 5 11111111111111111111111110101011= - 85 3. 混合表示法 許多情況下,運算過程中為了既滿足數值的動態(tài)范圍又保證一定的精度,就必須采用

 Q0與 Q15之間的表示法。比如,數值 近的數是 1,精度無法保證。因此,數 1.2345,顯然 Q15無法表示,而若用 1.2345最佳的表示法是 Q14。

 Q0表示,則最接 例 3.11 1.5× 0.75 = 1.125

 ×

 01.10000000000000 = 1.5 00.11000000000000 = 0.75 ; Q14 ; Q14 0001.0010000000000000000000000000 = 1.125;Q28 Q14的最大值不大于 2,因此,

 2個Q14數相乘得到的乘積不大于 4。

 一般的,若一個數的整數位為 i位,小數位為 j

 位,另一個數的整數位為 m 位,小數位為 n

 位,則這兩個數的乘積為

 ( i + m )

 位整數位和

 (j + n) 位小數位。這個乘積的最高16位可能的精度為 ( i + m ) 整數位和

 (15 - i - m) 小數位。

 · 54·

 但是,若事先了解數的動態(tài)范圍,就可以增加數的精度。例如,程序員了解到上述乘 積不會大于 1.8 ,就可以用 Q14 數表示乘積,而不是理論上的最佳情況 Q13 。例 3.11的TMS320C25 程序如下:

 LT OP1 ;OP1 = 6000H(1.5/Q14) MPY PAC OP2 ;OP2 = 3000H(0.75/Q14) SACH ANS,1 ;ANS = 2400H(1.125/Q13) 上述方法為了保證精度均對乘的結果舍位,結果所產生的誤差相當于減去 1個 LSB( 最低位 )。采用下面簡單的舍入方法,可使誤差減少二分之一。

 ·55·

 LT OP1

 MPY OP2 PAC ADD

 ONE, 14

 (上舍入 ) SACH ANS ,1

 上述程序說明,不管 ANS 為正或負,所產生的誤差是 1/2

 LSB ,其中存儲單元 ONE 的值為 1。

 3.3.2 定點加法 乘的過程中,程序員可不考慮溢出而只需調整運算中的小數點。而加法則是一個更加 復雜的過程。首先,加法運算必須用相同的 Q點表示;其次,程序員或者允許其結果有足

 夠的高位以適應位的增長,或者必須準備解決溢出問題。如果操作數僅為 16位長,其結果可用雙精度數表示。下面舉例說明 16位數相加的兩種途徑。

 1.保留 32位結果

 LAC OP1 ;(Q15) ADD OP2 ;(Q15) SACH ANSHI ;(高16位結果 ) SACL 2.調整小數點保留 ANSLO 16位結果 ;(低16位結果 ) LAC OP1,15 ;(Q14 數用 ACCH 表示 ) ADD OP2,15 ;(Q14 數用 ACCH 表示 ) SACH ANS ;(Q14) 加法運算最可能出現的問題是運算結果溢出。

 TMS320 提供了檢查溢出的專用指令 BV ,此外,使用溢出保護功能可使累加結果溢出時累加器飽和為最大的整數或負數。當然,即使如此,運算精度還是大大降低。因此,最好的方法是完全理解基本的物理過程并注意選擇數的表達方式。

 3.3.3 定點除法 在通用 DSP芯片中,一般不提供單周期的除法指令,為此必須采用除法子程序來實現。二進制除法是乘法的逆運算。乘法包括一系列的移位和加法,而除法可分解為一系列的減法和移位。下面來說明除法的實現過程。

 設累加器為 8位,且除法運算為 10除以 3。除的過程就是除數逐步移位并與被除數比較 的過程,在每一步進行減法運算,如果能減則將位插入商中。

 (1) 除數的最低有效位對齊被除數的最高有效位。

 · 56·

 00001010 - 00011000 11110010 (2) 由于減法結果為負,放棄減法結果,將被除數左移一位再減。

 ·57·

  00010100 - 00011000

 11111000 (3) 結果仍為負,放棄減法結果,被除數左移一位再減。

 00101000 - 00011000

 00010000 (4) 結果為正,將減法結果左移一位后加1,作最后一次減。

 00100001 - 00011000

 00001001

 (5)

 結果為正,將結果左移一位加 1得最后結果。高4位代表余數,低 4位表示商。00010011 即商為 0011=3 ,余數為 0001=1。

 TMS320 沒有專門的除法指令,但使用條件減指令 SUBC 可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個操作數必須為正。程序員必須事先了解其可能的運算 數的特性,如其商是否可以用小數表示及商的精度是否可被計算出來。這里每一種考慮可

 影響如何使用 SUBC 指令的問題。下面給出兩種不同情況下的 TMS320C25 除法程序。

 (1) 分子小于分母 DIV_A:

 LT NUMERA

 MPY DENOM PAC SACH

 TEMSGN

 ;取商的符號 LAC DENOM

 ABS

  SACL DENOM ;使分母為正 ZALH ABS NUMERA ;使分子為正 RPTK 14

 SUBC DENOM ;除循環(huán) 15次 SACL QUOT

 LAC TEMSGN

 · 58·

 BGEZ ZAC A1 ;若符號為正 ,則完成 SUB QUOT

 SACL QUOT ;若為負 ,則商為負 A1: RET

 ·59·

 這個程序中,分子在 NUMERA 中,分母在 DENOM 中,商存在 QUOT 中 , TEMSGN 為暫存單元。

 (2) 規(guī)定商的精度 DIV_B:

 LT NUMERA

 MPY DENOM

 PAC

  SACH TEMSGN ;取商的符號 LAC DENOM

 ABS

  SACL DENOM ;使分母為正 LACK 15

 ADD FRAC

 SACL FRAC ;計算循環(huán)計數器 LAC NUMERA

 ABS RPT

 FRAC ;使分子為正 SUBC DENOM ;除循環(huán) 16+FRAC 次 SACL QUOT

 LAC TEMSGN

 BGEZ B1 ;若符號為正 ,則完成 ZAC

  SUB QUOT

 SACL QUOT ;若為負 ,則商為負 B1: RET 與 DIV_A 相同,這個程序中,分子在 NUMERA

 中,分母在 DENOM 中,商存在 QUOT 中, TEMSGN 為暫存單元。

 FRAC 中規(guī)定商的精度,如商的精度為 Q13

 ,則調用程序前FRAC 單元中的值應為 13。

 3.4 非線性運算的定點快速實現 在數值運算中,除基本的加減乘除運算外,還有其他許多非線性運算,如對數運算、 開方運算、指數運算、三角函數運算等,實現這些非線性運算的方法一般有:

 (1) 調用 DSP

 · 60·

 編譯系統的庫函數; (2) 查表法; (3) 混合法。下面分別介紹這三種方法。1.調用 DSP編譯系統的庫函數 TMS320C2X/C5X 的C編譯器提供了比較豐富的運行支持庫函數。在這些庫函數中, 包含了諸如對數、開方、三角函數、指數等常用的非線性函數。在 C程序中 (也可在匯編程序中 )只要采用與庫函數相同的變量定義,就可以直接調用。例如,在庫函數中,定義了以 10為底的常用對數 log10( ) :

 ·61·

 # include <math.h> double log10(double x); 在 C程序中按如下方式調用:

 float x,y; x = 10.0; y = log10(x); 從上例可以看出,庫函數中的常用對數

  log10(

 )要求的輸入值為浮點數,返回值也為浮點數,運算的精度完全可以保證。直接調用庫函數非常方便,但由于運算量大,很難在實 時DSP中得到應用。2.查表法 在實時 DSP應用中實現非線性運算,一般都采取適當降低運算精度來提高程序的運算 速度。查表法是快速實現非線性運算最常用的方法。采用這種方法必須根據自變量的范圍和精度要求制作一張表格。顯然輸入的范圍越大,精度要求越高,則所需的表格就越大, 即存儲量也越大。查表法求值所需的計算就是根據輸入值確定表的地址,根據地址就可得到相應的值,因而運算量較小。查表法比較適合于非線性函數是周期函數或已知非線性函數輸入值范圍這兩種情況,例 3.12和例 3.13分別說明這兩種情況。

 例 3.12

 已知正弦函數

 y=cos(x) ,制作一個

 512點表格,并說明查表方法。由于正弦函數是周期函數,函數值在- 1至+ 1之間,用查表法比較合適。

 由于 Q15的表示范圍為-

 1至32767/32768 之間,原則上講-

 1至+ 1的范圍必須用

 Q14表示。但一般從方便和總體精度考慮,類似情況仍用 Q15表示,此時+ 1用32767來表示。

 (1) 產生 512點值的 C語言程序如下所示 :

 #define N 512 #define pi 3.14159 int sin_tab[512]; void

 main( ) { int i; for(i=0;i<N;i++) sin_tab[i]=(int)(32767*sin(2*pi*i/N)); } (2) 查表 查表實際上就是根據輸入值確定表的地址。設輸入 x在0~2 之間,則 x對應于 512點表

 · 62·

 的地址為:

 index = (int)(512*x/2 ),則 y = sin(x) = sin_tab[index] 。

 如果 x用 Q12 定點數表示,將 512/2 用 Q8表示為 20861,則計算正弦表的地址的公式 為:

 index = (x*20861L)>>20 。

 例 3.13 用查表法求以 2為底的對數,已知自變量取值范圍為 0.5~1,要求將自變量范圍均勻劃分為 10等分。試制作這個表格并說明查表方法。

 (1) 做表:

 y

 =

 log2(x) ,由于 x在0.5到1之間,因此

 y在- 1到0之間, x和y均可用 Q15 表示。由于對 x 均勻劃分為

 10段,因此,

 10段對應于輸入 x的范圍如表

 3.2所示。若每一段的對數值都取第 1

 ·63·

 點的對數值,則表中第 1段的對數值為 y0(Q15) = (int)(log2(0.5) × 32768),第 2段的對數值為 y1(Q15) = (int)(log2(0.55)

 ×32768) ,依次類推。

 表3.2 logtab0 10 點對數表 (輸入0.5~1) 地址

 輸入值 對數值 (Q15) 0

 0.50~0.55 - 32768 1

 0.55~0.60 - 28262 2

 0.60~0.65 - 24149 3

 0.65~0.70 - 20365 4

 0.70~0.75 - 16862 5

 0.75~0.80 - 13600 6

 0.80~0.85 - 10549 7

 0.85~0.90 - 7683 8

 0.90~0.95 - 4981 9

 0.95~1.00 - 2425

 (2) 查表 : 查表時,先根據輸入值計算表的地址,計算方法為:

 index=((x - 16384) × 20)>>15 。式中, index 就是查表用的地址。例如,已知輸入 x= 26869 ,則 index=6 ,因此 y=- 10549。

 3.混合法 (1) 提高查表法的精度 上述方法查表所得結果的精度隨表的大小而變化,表越大,則精度越高,但存儲量也越大。當系統的存儲量有限而精度要求也較高時,查表法就不太適合。那么能否在適當增加運算量的情況下提高非線性運算的精度呢?下面介紹一種查表結合少量運算來計算非線性函數的混合法,這種方法適用于在輸入變量的范圍內函數呈單調變化的情形。

 混合法是在查表的基礎上采用計算的方法以提高當輸入值處于表格兩點之間時的精度。提高精度的一個簡便方法是采用折線近似法,如圖 3.1所示。

 仍以求以

 2為底的對數為例 (例3.13) 。設輸入值為 x,則精確的對數值為 y,在表格值的兩點之間作一直線,用 y'作為 y的近似值,則有:

 y'= y 0 + y

  y

  y " y 0

  y

  x y 0

 x 0

 x 0

 x

 圖3.1 提高精度的折線近似法

 · 64·

 其中 y 0 由查表求得,F在只需在查表求得 y 0 的基礎上增加 y即可。

 y的計算方法如下:

 y=( x/ x 0 ) y= x( y 0 / x 0 ) 式中 y 0 / x 0 對每一段來說是一個恒定值,可作一個表格直接查得。此外計算 x時需用到每段橫坐標的起始值,這個值也可作一個表格。這樣共有 三個大小均為 10 的表格,分別為存儲每段起點對 數 值 的 表 logtab0 、 存 儲 每 段 y 0 / x 0

 值 的 表 logtab1 和存儲每段輸入起始值 x 0 的表 logtab2 ,表 logtab1 和表 logtab2可用下列兩個數組表示:

 ·65·

 int logtab1[10]={22529,20567,18920,17517,16308, 15255,14330,13511,12780,12124}; /* y 0 / x 0 : Q13*/ int logtab2[10]={16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130}; /* x 0 : Q15*/ 綜上所述,采用混合法計算對數值的方法可歸納為:

、俑鶕斎胫,計算查表地址:

 index=((x - 16384)× 20)>>15; ②查表得 y 0 =logtab0[index]; ③計算 x=x - logtab2[index]; ④計算 y= ( x× logtab1[index])>>13;

、萦嬎愕媒Y果 y=y 0 + y。

 例 3.14 已知 x=0.54 ,求 log2(x) 。

 0.54的精確對數值為y=log2(0.54)= - 0.889 ;旌戏ㄇ髮抵档倪^程為:

、俣 Q15,定標值 x=0.54*32768=17694 ; ②表地址 index=((x - 16384)× 20)>>15=0; ③查表得 y 0 =logtab0[0]= - 32768; ④計算 x=x - logtab2[0]=17694 - 16384=1310; ⑤計算 y= ( xlogtab1[0])>>13=(1310*22529L)>>13=3602; ⑥計算結果

 y=y 0 + y=- 32768+3602= - 29166。

 結果 y為Q15定標,折算成浮點數為 - 29166/32768= - 0.89,可見精度較高。

 (2) 擴大自變量范圍 如上所述,查表法比較適用于周期函數或自變量的動態(tài)范圍不是太大的情形。對于像對數這樣的非線性函數,輸入值和函數值的變化范圍都很大。如果輸入值的變化范圍很

 大,則作表就比較困難。那么能否比較好地解決這個問題,既不使表格太大,又能得到比較高的精度呢?下面討論一種切實可行的方法。

 設 x是一個大于 0.5的數,則 x可以表示為下列形式:

 x = m 2 e

 式中, 0.5≤ m≤ 1.0,e為整數。則求 x 的對數可以表示為:

 log2(x) = log2( m 2 e

 ) = log2(m) + log2( 2 e

 ) = e + log2(m)

 · 66·

 也就是說,求 x的對數實際上只要求 m的對數就可以了,而由于 m的數值在 0.5~1.0 之間, 用上面介紹的方法是完全可以實現的。例如:

 log2(10000) = log2(0.61035 × 214 ) = log2(0.61035) + 14 = 13.2877

 可見,如果一個數可以用比較簡便的方法表示為上面的形式,則求任意大小數的對數 也是比較方便的。

 TMS320C2X/C5X 指令集提供了一條用于對 ACC 中的數進行規(guī)格化的指令 NORM ,該指令的作用就是使累加器中的數左移,直至數的最高位被移至累加器的第 30位。例如,對數值 10000進行規(guī)格化的 TMS320C25 程序為:

 LAC #10000 SACL TEMP ZALH TEMP

 ·67·

 Q LAR AR1,#0FH RPT 14 NORM * - 上述程序執(zhí)行后, AR1=#0eH , ACCH=2000(10 進制 )。對一個

 16位整數 x 進行上述程序處理實際上就是做這樣一個等效變換:

 x = x 2 2 15 Q 32768 其中,寄存器 AR1 包含的值為 15- Q ,累加器 ACC 高 16 位包含的值為16384~32768之間。

 例 3.15 實現以 2為底的對數的 C定點模擬程序 int logtab0[10] ={ - 32768,- 28262,- 24149,- 20365,- 16862, - 13600,- 10549,- 7683,- 4981,- 2425}; /*Q15*/ int logtab1[10] ={22529,20567,18920,17517,16308, 15255,14330,13511,12780,12124}; /*Q13*/ int logtab2[10] ={16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130}; /*Q15*/ int log2_fast(int Am) {

 x 2 Q

  ,其數值在 int point,point1; int index,x0,dx,dy,y; point =0; while(Am<16384) {point++ ; Am =Am<<1;} /* 對 Am 進行規(guī)格化 */ point1 = (15- point - 4)*512; /* 輸入為 Q4,輸出為 Q9*/ index = ((Am - 16384)*20L)>>15; /* 求查表地址 */ dx = Am- logtab2[index]; dy = ((long)dx*logtab1[index])>>13; y= (dy+logtab0[index])>>6;

 · 68·

  /*Q9*/ y= point1+y; return (y); } 上述程序中,輸入值 Am 采用 Q4表示,輸出采用 Q9表示,如果輸入輸出的 Q值與上面程序中的不同,則應做相應的修改。

 3.5 小 結 本章討論了DSP 芯片進行定點運算所涉及的一些基本問題,這些問題包括:數的定標, DSP程序的定點模擬, DSP芯片的定點運算以及定點實現非線性函數的快速實現方法等。充分理解這些問題對于用定點芯片實現 DSP算法具有非常重要的作用。

相關熱詞搜索:運算 講解 格式

版權所有 蒲公英文摘 m.newchangjing.com