运用Excel模糊匹配物资实现精准对量的三种方法比较程 韬(昆明中天正和工程造价咨询有限公司,云南昆明650200)【摘要】由于设计、建设、施工、第三方咨询单位在数据生成工具选用和称谓习惯的不同,以及可能的拼写错误,同一种物资会出现不同的名称叫法。加上工程物资规格种类繁多,人工梳理或是一般性的菜单操作难以胜任快速高效的查找与对量工作。为此,有必要研究更为有效的解决方案。模糊匹配算法可以处理一系列数据歧义,例如字符颠倒、缩略语、单字或词组拼写错误、不规范的标点符号等,获得最接近的匹配结果。鉴于Excel在数据呈现与处理方面的广泛运用基础,在其强大的数据清洗、排序检索功能以及二次开发能力的加持下,能较为便利地实现字符串的模糊匹配。一般而言,模糊匹配可以使用Excel组合公式、内嵌的PowerQuery查询或是基于VBA代码的编辑距离法实现。以上三种方法有各自的优点和局限性,其中前两者虽易于上手但制约略多,VBA编程法强大但较难以掌握。文章通过对三种方法思路及关键步骤的阐述,结合图表范例演示,以更好地展示各自的适用情形。【关键词】Excel模糊匹配PowerQuery编辑距离【中图分类号】TP391【文献标识码】A【文章编号】1008-2166(2023)05-081-07【DOI】10.19730/j.cnki.1008-2166.2023-05-081ThreeMethodsofUsingExcelFuzzyMatchingMaterialstoAchieveAccurateMatchingofQuantitiesChengTao(KunmingJ&REngineeringCostConsultingCo.Ltd.,Kunming650200,China)【Abstract】Duetothedifferentselectionandnaminghabitsofdesign,construction,construction,andthird -partyconsultingunitsindatagenerationtools,aswellaspossiblespellingerrors,differentnamesandnameswillappearforthesamematerial.Inaddition,therearemanytypesofengineeringmaterialspecifications,andmanualcombingorgeneralmenuoperationsaredifficulttoquicklyandefficientlyfindandmeasurework.Tothisend,itisnecessarytostudymoreeffectivesolutions.Fuzzymatchingalgorithmscanhandlearangeofdataambiguities,suchascharacterreversals,abbreviations,misspellingsofwordsorphrases,irregularpunctuation,etc.,toobtaintheclosestmatchingresult.InviewofExcel'sextensiveapplicationbaseindatapresentationandprocessing,withitspowerfuldatacleaning,sortingandretrievalfunctions,andsecondarydevelopmentcapabilities,itcaneasilyachievefuzzymatchingofstrings.Ingeneral,fuzzymatchingcanbeachievedusingExcelcombinationformulas,embeddedpowerqueryqueries,orVBAcode-basededitingdistancemethods.Theabovethreemethodshavetheirownadvantagesandlimitations,thefirsttwoofwhichareeasytousebutslightlymoreconstrained,andtheVBAprogrammingmethodispowerfulbutmoredifficulttomaster.Throughtheelaborationofthethreemethodideasandkeysteps,combinedwiththediagramexampledemonstration,tobettershowtherespectiveapplicablescenarios.【Keywords】Excel;Fuzzymatching;PowerQuery;LevenshteinDistance作者简介:程 韬(1976—),男,云南昆明人,经济师,主要从事项目可行性研究、工程经济分析、造价咨询等工作。收稿日期:2023年3月EngineeringCostManagementDigitalCost81
工程造价管理/2023年第5期一、引言在造价工作中,有时会遇到工程耗用物资与实际领用物资进行数量对比的需要。若是包工包料的工程,物资核对可能没有必要,建设单位只需在合同总价范围内关注成本、质量、进度、安全四大要素即可。但若是典型特征的清包工程,特别是甲供物资规格繁多的专业工程,物资管控就尤为必要。结合自身从业
运用Excel模糊匹配物资实现精准对量的三种方法比较(论文).pdf