農林漁牧網

您現在的位置是:首頁 > 畜牧業

SPSS Modeler 讀取Excel檔案資料

2021-12-07由 醫數思維雲課堂 發表于 畜牧業

spss怎麼抽取資料

SPSS Modeler 讀取Excel檔案資料

在SPSS Modeler中,商業理解是資料專案的第一步,資料讀取是使用者開始操作的第一步。

SPSS Modeler源節點能夠匯入以多種格式儲存的資料,這些格式包括平面檔案、 IBM SPSS Statistics(。sav)、SAS、Microsoft Excel 和ODBC相容關係資料庫。也可以使用使用者輸入節點生成綜合資料。Modeler內部本身已將包含了足夠多的案例資料檔案,可以在安裝目錄下找到Demos資料夾。

案例:

Demos檔案下“bank_customer_data。xlsx”的Excel資料檔案。

SPSS Modeler 讀取Excel檔案資料

Excel 源節點

使用 Excel 源節點可從 Microsoft Excel 以 。xlsx 檔案格式匯入資料。

1.1 資料

SPSS Modeler 讀取Excel檔案資料

1.11 檔案型別

選擇要匯入的 Excel 檔案型別。

1.12 匯入檔案

指定要匯入的電子表格檔案的名稱和位置。

1.13 使用指定的範圍

選中此選項可以指定在 Excel 工作表中定義的單元格的指定範圍。單擊省略按鈕 ( 。。。 ) 從可用範圍列表中進行選擇。如果使用指定範圍,則其他工作表和資料範圍設定將不再可用並最終被禁用。

1.14 選擇工作表

按索引或者按名稱指定要匯入的工作表。

• 按索引 指定要匯入的工作表的索引值,開頭的 0 表示第一個工作表,1 表示第二個工作表,依此類推。

• 按名稱 指定要匯入的工作表的名稱。單擊省略按鈕 ( 。。。 ) 從可用工作表列表中進行選擇。

1.15 工作表範圍

可以第一個非空行作為開始匯入資料,也可透過單元格的顯式範圍匯入資料。

• 範圍從第一個非空行開始 找到第一個非空單元格,並將此單元格作為資料範圍的左上角單元格。

• 單元格的顯式範圍 選中此選項可按行和列指定顯式範圍。例如,要指定 Excel 範圍 A1:D5,您可以在第一個欄位中輸入 A1,在第二個欄位中輸入 D5,(或,R1C1 和 R5C4)。指定範圍內的所有行都將返回,包括空行。

1.16 對於空行

如果遇到多個空行,則可選擇停止讀取,或選擇返回空行以繼續讀取所有資料(包括空行)直到工作表的末尾。

第一行存在列名稱 表示指定範圍中的第一行應作為欄位(列)名使用。如果未選中此選項,那麼將自動生成欄位名稱。

1.2 過濾器

實現對欄位的移除及欄位的重新命名。

SPSS Modeler 讀取Excel檔案資料

1.3 型別

實現對欄位測量級別以及欄位角色的定義。

SPSS Modeler 讀取Excel檔案資料

1.4 註解

為節點新增必要的註解及關鍵字。

SPSS Modeler 讀取Excel檔案資料

SPSS Modeler 讀取Excel檔案資料

1.5 欄位儲存和測量級別

從 Excel 中讀取值時,預設情況下將按連續的測量級別讀取以數值儲存的欄位,按名義讀取以字串儲存的欄位。可以在“型別”選項卡上手動更改測量級別(連續和名義),但儲存型別是自動確定的(雖然必要時可在過濾節點或匯出節點中使用轉換函式,例如 to_integer,來更改此型別)。

預設情況下,將按數字型別讀取以數字和字串值混合儲存的欄位,這意味著在 IBM SPSS Modeler 中所有字串值都將被設定為空(系統缺失)值。這是因為與Excel不同,IBM SPSS Modeler不允許欄位中存在混合的儲存型別。要避免此問題,可以在Excel電子表格中手動將單元格格式設定為文字 ,這樣將按字串讀取所有的值(包括數字)。