【Google 試算表】如何移除重複內容?用函數或內建功能都可以!

現在資訊大爆發,常常要處理大量的資料,但如果表格裡出現重複的資料時,有沒有好的方式來去除它?其實在 Google 試算表裡面,就有內建的方式,除此之外,還有一個特別的函數來解決這個問題,來看看要怎麼用吧!

歡迎來到《數位小幫手》網站,閱讀文章之前請先了解我們的免責聲明與使用條款隱私權政策

點擊追蹤數位小幫手社群平台:Threads、Instagram、Twitter…等等。

什麼是移除重複內容?

所謂的「移除重複內容」,就是從工作表裡面一定範圍裡面的資料表格中,移除掉重複的資料內容。

如果要檢查的是「單欄的資料欄」,那只要這個資料欄中有重複的內容,就會被移除。

如果要檢查的是「多欄的資料欄」,假設為兩欄,那兩欄的資料都要一樣,才能夠被移除掉。

那要怎麼樣才能被認定為「重複內容」呢?

在 Google 的文件編輯器說明中,有提到相關的定義:「即使儲存格中值的字母大小寫、格式設定或公式皆不同,只要值的內容相同,即可視為重複內容。」


用內建功能來移除重複內容

移除重複內容的路徑

選取 資料資料清除移除重複內容,即可打開「移除重複內容」的操作介面。

點擊資料→資料清除→移除重複內容


框選單一資料欄

先試試看移除單欄的重複資料,把表格內的其中一欄資料欄框選起來之後,使用 移除重複內容 的功能。

框選單一資料欄

畫面就會跳出一個「移除重複內容」的對話框,確認設定沒有問題之後,就可以按右下角的 移除重複內容 的按鈕。

移除重複內容

接著就會跳出找到了幾個重複列,並且剩下了幾個不重複列。

找到了幾個重複列與不重複列

不重複列的內容,就會顯示在原本框選的儲存格範圍內的頂部。

不重複列會顯示在原本的儲存格範圍內


框選多個資料欄

如果框選的是多個資料欄,那它要比對的資料就是一整列的資料,上下兩列的資料都一樣的時候,才會被視為重複的內容。

框選多個資料欄

所以根據圖中的表格來看,表格裡的第三列跟第四列為重複的值,因此其中一個就被移除掉了。

重複的列被移除掉了


注意事項

  • 如果選取的儲存格範圍內,有「合併儲存格」的話,那它也會跳出一個警示說:「你選取的範圍包含合併的儲存格。如要移除重複內容,所有儲存格必須含有相同的列數與欄數」
  • 如果只是選取【單一儲存格】,但不在有「值」的表格內的話,就算那個儲存格裡面有「值」,它還是會跳出警示說:「請選取裡面已經有值的儲存格範圍。」
  • 如果選取的【單一儲存格】在有「值」的表格範圍內的話,點選「移除重複內容」之後,它會擴大「檢查範圍」到整體表格,而非單一資料欄。所以,如果想特別移除掉某一資料欄的重複內容的話,一定要先特別框選那個資料欄。



用函數來移除重複內容

除了使用 Google 試算表內建的功能之外,也可以使用函數來移除重複內容,也就是 UNIQUE 函數,函數的公式語法為:

=UNIQUE(範圍,[by_column],[exactly_once])

最常用的就是第一個引數「範圍」。後面兩個引數的預設都是「False」,通常都不會動到,可以忽略掉。

接下來就來實際測試一下這個 UNIQUE 函數吧!

在儲存格裡面輸入 UNIQUE 公式

首先在儲存格裡面,輸入 UNIQUE 的函數,並且填入要檢查的表格範圍,後面引數用不到可以忽略。所以公式為:

=UNIQUE(B2:E6)
輸入UNIQUE函數跟公式

只要輸入完這個公式,按 Enter 後就可以看到表格內的重複內容被移除掉了,剩下沒被移除掉的表格內容,會在新的儲存格展開陣列。

UNIQUE函數陣列展開的結果


改變檢查方式

而這個函數其實還有其他的特點,因為一般移除重複值,都是一列一列的檢查,如果想要一欄一欄的檢查的話,可以在 UNIQUE 公式的第二個引數裡輸入 TRUE,這樣函數檢查的方向就會改變。範例公式如下:

=UNIQUE(B2:E6,TRUE)
UNIQUE公式使用兩個引數的結果
C 欄和 D 欄,因內容重複而被刪除掉其中一欄


重複的內容都不回傳

除了可以改變檢查的方向之外,UNIQUE 函數還具備了第三種功能,就是重複的內容都刪除掉,不顯示出來。

主要看檢查的方向,如果 A 欄跟 B 欄為重複內容,A 欄跟 B 欄都不會顯示在 UNIQUE 的陣列當中。如果 C 列跟 D 列為重複內容,C 列跟 D 列也不會顯示在 UNIQUE 所展開的陣列當中。範例公式如下:

=UNIQUE(B2:E6,TRUE,TRUE)
UNIQUE公式使用三個引數的結果


為什麼還是會出現重複的內容?

如果系統傳回重複的列,可能有兩種原因:

  1. 有隱藏的文字資料:比較常見的可能是儲存格裡面有隱藏的資料類型,像是空格、或是難以辨認的文字顏色等等的狀況。
  2. 數值的格式不同:需要確定數值的格式有沒有一樣,例如百分比要應為百分比格式,幣值則應設為幣值格式。

訂閱《數位小幫手電子報》《Telegram》

結語

其實 UNIQUE 函數的結構滿簡單的,而且通常都用不到後面兩個引數,只要在儲存格輸入「UNIQUE 的函數」跟「資料範圍」,也可以很快找出表格的重複資料列,同時還不會更動到原本表格的內容,這也是函數的優勢之一。

延伸閱讀

References:Spreadsheetpoint文件編輯器說明

原網站| digitalyoming.com ( 未經許可,禁止轉載 ) 
原網址|https://digitalyoming.com/how-to-remove-duplicates-in-google-sheets/