对于数据科学家来说,繁重的工作仍然是第一要务。
一项最新发布的调查显示,数据获取和清理的麻烦,模型和数据隐私的问题以及难以找到经验和技术技能,这些都是数据科学家和数据科学领域的软件工程师所面临的最大挑战。 Anaconda是科学计算应用程序的同名Python发行版的制造商,它对100个国家/地区的2,360名受访者进行了2020年数据科学状况调查,略低于美国的一半。
尽管近年来在数据科学工作环境中取得了所有进步,但数据繁琐仍然是数据科学家工作日的重要组成部分。根据受访者的自我估计,数据加载和清理分别花费了19%和26%的时间,几乎占总时间的一半。模型选择,培训/评分和部署总共约占34%(单独完成每个任务约11%)。
在将数据科学工作投入生产时,对于数据科学家,开发人员和系统管理员一样,最大的总体障碍是如何满足其组织的IT安全标准。至少其中一些与大规模部署任何新应用程序的难度相符,但是机器学习和数据科学应用程序的生命周期面临着自己的挑战,例如保持多个开源应用程序堆栈针对漏洞进行修补。 受访者提到的另一个问题是机构所教授的技能与企业环境所需技能之间的差距。
大多数大学都开设了统计学,机器学习理论和Python编程课程,并且大多数学生都在学习此类课程。但是企业发现自己最需要的是很少或根本没有教授的数据管理技能,以及学生不经常开发的高级数学技能。学生们自己感到缺乏经验(40%)和技术技能(26%)是该领域工作的最大障碍,缺点是(强有力的实习计划)可以更好地解决(根据Anaconda所提供的)和动手键盘技术技能。
” 报告中的一项发现应该不会令任何人感到惊讶:Python仍然是数据科学领域使用的语言之王。 R位居第二,而JavaScript,Java,C / C ++和C#紧随其后。尽管尚未在数据科学领域争夺者茱莉亚(Julia)不在名单中,但尚不清楚那是因为它没有被足够的受访者回答,还是因为调查没有提及它。
版权所有©2020 IDG Communications,Inc. 紧贴InfoWorld的新闻通讯,以了解软件开发人员,分析师,数据库程序员和数据科学家的情况。 从我们仅限会员的内幕文章中获取专家见解。
。
Yorumlar
Yorum Gönder