Excel MVP атакуват проблема с почистването на данни в Power Query - Съвети на Excel

Съдържание

Забележка

Това е една от поредицата статии, описващи подробно решения, изпратени за предизвикателството на Podcast 2316.

Excel MVP Oz Du Soleil от Excel on Fire канал в YouTube спомена бразилския Bull Rider Kaique Pachecho. Оз беше първият човек, който забеляза, че отидох по бавния начин, за да добавя четирите четвърти.

Видеото на Oz е:
https://www.youtube.com/watch?v=OluZlF44PNI

Кодът му е:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Removed Columns" = Table.RemoveColumns(Source,("Column2", "Column3", "Column4", "Column5", "Column6")), #"Transposed Table" = Table.Transpose(#"Removed Columns"), #"Promoted Headers" = Table.PromoteHeaders(#"Transposed Table", (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Administrative", type number), ("Holiday", Int64.Type), ("PTO/LOA/Jury Duty", Int64.Type), ("Project A", type number), ("Project B", type number), ("Project C", type number))), #"Added Conditional Column" = Table.AddColumn(#"Changed Type", "Custom", each if (Category Description) = "Q1" then null else if (Category Description) = "Q2" then null else if (Category Description) = "Q3" then null else if (Category Description) = "Q4" then null else (Category Description)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Custom")), #"Renamed Columns" = Table.RenameColumns(#"Filled Down",(("Custom", "Names"))), #"Filtered Rows" = Table.SelectRows(#"Renamed Columns", each (Category Description) = "Q1" or (Category Description) = "Q2" or (Category Description) = "Q3" or (Category Description) = "Q4"), #"Reordered Columns" = Table.ReorderColumns(#"Filtered Rows",("Names", "Category Description", "Administrative", "Holiday", "PTO/LOA/Jury Duty", "Project A", "Project B", "Project C")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Reordered Columns", ("Names", "Category Description"), "Attribute", "Value"), #"Pivoted Column" = Table.Pivot(#"Unpivoted Other Columns", List.Distinct(#"Unpivoted Other Columns"(#"Category Description")), "Category Description", "Value", List.Sum), #"Inserted Sum" = Table.AddColumn(#"Pivoted Column", "Addition", each List.Sum(((Q1), (Q2), (Q3), (Q4))), type number), #"Renamed Columns1" = Table.RenameColumns(#"Inserted Sum",(("Addition", "TOTAL"))) in #"Renamed Columns1"

Друго решение, това от Excel MVP John MacDougall.

  • Джон е първият, който казва, че като изтриете двете допълнителни стъпки, добавени в Power Query, вие елиминирате странните суфикси в дублиращите се заглавия Q1 Q2 Q3 Q4.
  • Джон използва индексна колона рано, която ще бъде използвана в края за сортиране. Но - Джон обедини своята индексна колона след описанието на категорията. Той използва символ на вертикална тръба | за да може да раздели данните по-късно.
  • Джон въведе условната си колона като персонализирана колона, вместо да използва интерфейса на условната колона.
Условна колона като персонализирана колона

Вижте видеото на Джон тук:
https://www.youtube.com/watch?v=Dqmb6SEJDXI

Excel MVP Кен Пулс, съавтор на M is for (Data) Monkey book, изпратен в три решения. Условната му колона е може би най-кратката.

Но предпочитаното решение на Кен игнорира първоначалния въпрос. Вместо да създава таблицата в Power Query, той създава въртящ се набор от данни в Power Query и след това завършва с обобщена таблица.

Последният преглед на Кен в Power Query изглежда така:

Въртящ се набор от данни

Ето кода на Кен:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Promoted Headers" = Table.PromoteHeaders(Source, (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Dept. Total", type number), ("Q1", type number), ("Q2", type number), ("Q3", type number), ("Q4", Int64.Type), ("Employee 1", type number), ("Q1_1", type number), ("Q2_2", type number), ("Q3_3", Int64.Type), ("Q4_4", Int64.Type), ("Employee 2", Int64.Type), ("Q1_5", Int64.Type), ("Q2_6", Int64.Type), ("Q3_7", Int64.Type), ("Q4_8", Int64.Type), ("Employee 3", Int64.Type), ("Q1_9", Int64.Type), ("Q2_10", Int64.Type), ("Q3_11", Int64.Type), ("Q4_12", Int64.Type), ("Employee 4", type number), ("Q1_13", type number), ("Q2_14", type number), ("Q3_15", type number), ("Q4_16", Int64.Type))), #"Removed Columns" = Table.RemoveColumns(#"Changed Type",("Dept. Total", "Q1", "Q2", "Q3", "Q4")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Removed Columns", ("Category Description"), "Attribute", "Value"), #"Added Conditional Column" = Table.AddColumn(#"Unpivoted Other Columns", "Employee", each if Text.Contains((Attribute), "_") then null else (Attribute)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Employee")), #"Split Column by Delimiter" = Table.SplitColumn(#"Filled Down", "Attribute", Splitter.SplitTextByEachDelimiter(("_"), QuoteStyle.Csv, false), ("Attribute.1", "Attribute.2")), #"Changed Type1" = Table.TransformColumnTypes(#"Split Column by Delimiter",(("Attribute.1", type text), ("Attribute.2", Int64.Type))), #"Filtered Rows" = Table.SelectRows(#"Changed Type1", each ((Attribute.2) null)), #"Removed Columns1" = Table.RemoveColumns(#"Filtered Rows",("Attribute.2")), #"Renamed Columns" = Table.RenameColumns(#"Removed Columns1",(("Attribute.1", "Quarter"), ("Value", "Amount"))), #"Changed Type2" = Table.TransformColumnTypes(#"Renamed Columns",(("Category Description", type text), ("Quarter", type text), ("Amount", type number), ("Employee", type text))) in #"Changed Type2"

След като създаде тази заявка само като връзка, той използва обобщена таблица, за да създаде окончателния отчет.

Окончателен отчет с обобщена таблица

Решения от други MVP:

  • Кодът на Уин Хопкинс е тук: Power Query: Справяне с множество идентични заглавия.
  • Кодът на Майк Гирвин е тук: Power Query: Извличане на леви 2 знака от колона.
  • Решението за формула на Роджър Говиер е тук: Решения за формула.

Върнете се на главната страница за предизвикателството Podcast 2316.

Прочетете следващата статия от тази поредица: Power Query: Отвъд потребителския интерфейс: Table.Split и др.

Интересни статии...