WFU

2020年5月10日 星期日

在MedCalc中重新調整類別變項顯示名稱與順序


洪明輝醫師




  
玩了一陣子的Postcrossing,我把從歐洲寄來的明信片依照國家別做了一個簡單的整理。資料長這樣子,寄出的國家各有兩個字元的編碼,例如FR代表法國,但是O則是大雜燴的沒被編到的其他國家集合。



我想要用一張圖表示我收到的明信片最常來自那三個國家

從指令列開始:Statistics/Crosstabs/Frequencies bar chart…,透過下列的對話框,可以得到預設的頻率直方圖。





預設的直方圖有一些小瑕疵,所以稍微做點編輯加工。


因為國家編碼的緣故,圖片其實不易閱讀,而且MedCalc軟體的預設組類別順序,會依照字元A to Z的順序排列,所以可以看到大雜燴的其他國家,左邊有代表挪威的NO,右邊是代表瑞典的SE。我們可以透過將類別變數個別標籤的編輯,用Lable來取代Value的呈現方式。這個時候,如果要同時保留圖片上X軸國家別仍有字母A to Z的依序原則,需要手動依照Lable的字母順序重新調整15的先後順序。



調整完後,再重新出一次頻率的直方圖,就會得到下面這張圖。



到這裡,希望一眼就看出最多明信片的前三名國家,所以如果能夠依照頻率高低,依據排列下來,應該會是比較理想的選擇。所以回到上一個步驟的手動排序,只要調整15的順序改為Germany-Sweden-Norway-France-Other,再重新出一次頻率直方圖。



這張圖,應該一眼就可以看出來左邊三個,就是頻率最高的前三個國家了。

後記:
  1. 預設的出圖minor tick設定值為1,在預設的圖形上代表0.5的數值,但我應該不會收到半張的那種明信片吧!所以調整為0比較合理。
  2. 保留Grid,方便對Y軸次數值。如果取消Grid顯示,畫面會更清爽。各有考量。
  3. X軸的Country似乎是多餘的了。