佳作译介丨当STS遇上数据科学
2019/8/18 21:22:31李子玄 科学传播人

     导读

     科学技术与社会研究(science and technology studies或science, technology and society studies,下文简称STS)和近年来炙手可热的数据科学之间在某些方面有着惊人的亲缘关系。虽然二者的研究方式和目的存在差异,但二者的研究框架都在社会学意义和科学技术意义上同步进行尝试。这两个领域的学科交叉日益增长,为STS学者带来了不少棘手的挑战,同时也提供了许多研究机遇。

     今天,“科学传播人”为大家推介的是由David Ribes发表在Science,Technology and Human Values上的文章——“STS, Meet Data Science, Once Again”(当STS再一次遇到数据科学)。作者通过探讨STS与数据科学之间有选择的亲和性,阐述两个领域之间的学科交叉如何为STS研究带来机遇和挑战,并建议STS学者积极探索科学的所有层面,拓宽学术、工业和社会相结合领域的变革广度。

     作者简介

    

     David Ribes

     本文作者David Ribes,来自华盛顿大学人本设计工程学院(Human Centered Design & Engineering, University of Washington),研究兴趣集中在社会学、哲学和历史的交叉领域,关注数字科学中的社会技术层面,专注于研究在技术、政策和社会组织不断变化的环境中研究的基础设施如何支持科学调查的开展。

     研究背景

     在最近的各类学术会议、工作坊等场合中,本文作者发现许多STS学者都在讨论数据科学,而且大多数人并非只是将其作为一个研究课题,而是深入参与其中,例如进行课程设置、加入研究项目、在政策设计和评估上参与合作等。在教学、认识论改革、社会福利、伦理责任等领域,STS学者都不同程度上从事着数据科学的工作。关于数据科学是什么或数据科学家是谁的争论由来已久。计算研究协会(Computing Research Association,CRA)在2016年给出的定义是:“我们从最广泛的意义上使用‘数据科学’这一术语,包括数据收集、数据工程、数据分析、数据结构等。”数据科学的整体基调是以“数据”作为研究对象,以强有力的工程思维来探索和促进数据的转换、交互和呈现。数据科学将自己定位为一门普适性科学,将成为所有未来科技的基础,与工业和国家息息相关。无论是在社交媒体、金融行业还是公共政策领域,关于公众数据的研究项目如雨后春笋般涌现,然而数据科学的野心远不止于此。STS学者所使用的方法、概念和技巧使得他们探索数据科学深层技术能力和逻辑时处于优势地位,因为STS学者不仅仅停留在数据可直接观测到的结果层面,而是更注重数据与其他学科的互操作性。

     本文重点探讨了数据科学与STS之间的两种有选择的亲和性。研究者认为这两个关系特征帮助STS学者更好地参与并形塑数据科学。当然,这些机会也伴随着不少挑战,例如如何重新定义社会、技术和科学之间的边界,以及如何处理长期以来对社会科学(包括STS)作为一种“服务性科学”的刻板印象。

     有选择的亲和性

     有选择的亲和性(elective affinity)由社会学家马克思·韦伯提出,描述了这样一种关系,在这种关系中,具有某种相似性并共享某些意义(例如宗教、知识,在本文中特指社会技术)的一组元素之间相互吸引、相互影响、相互融合、共同选择和促进。STS和数据科学在过去十几年里通过有选择的亲和性相互支持,并且这种互惠关系将会持续增强。

     研究者在本文中追溯了STS和数据科学之间两种有选择的亲和性,研究论据基于过去20年来对美国学术项目和科学政策的调查。

     亲和性一:社会性

     无论是十多年前的网络基础设施CI(Cyberinfrastructure),还是现在的数据科学,都不得不关注“社会性”这一举足轻重的因素。在本文中,作者对社会性的定义是“特定的历史性和制度性共同安排的结果”。广义而言,社会性是边界的产物,例如在本文中,边界将社会与技术科学区分开来。比起学术界,数据科学这一术语在硅谷这样的产业界中的应用速度更快,现在也开始出现在国家机构和非政府组织中——这就体现了数据科学中社会性的扩展。在过去十年里,社会各界都开始意识到数据的重要性。数据的流通、转换和互动操作在逐渐“政治化”,出现了一大批活动家、看门人、监管机构、学术组织和政府部门,从新闻、公民自由、隐私、监管等多方位进行数据的管理与分析。

     在数据科学技术推广的蓝图中,有关组织、体制、教育、伦理等问题耦合在一起受到更大的关注。在这样的背景下,STS学者在参与度、领导力、批判性和价值评估等方面都可以扮演重要角色。尽管“社会性”在STS和数据科学中的表现形式并不完全一致,但我们可以看到它们在研究术语、意义和方法上具有有选择的亲和性,而这将会给STS学者在数据科学领域的参与提供全新的机会。

     亲和性二:域逻辑

     “域”(domain)最初被广泛应用于计算机和信息科学领域,其次是商业、图书馆学及其它领域,如今在数据科学领域又取得了新的成果。域是数据科学的一个关键元素,并且由于域的某些特征在社会科学的范畴内,域的逻辑侧面展示了社会科学在数据科学中的角色和效用。粗略来说,域是指与某一专业相关的领域。例如,语言学是语言的域科学,生物学是有机生物的域科学等。域逻辑将世界分为两类——一类在域中,一类独立于任何域。有一些“非域”的专业模式和技术,通常被定义为“域独立”。一种域独立的数据分析工具可能在地理学和生物学中都具有效用。哪些专业在从事域独立的活动,是一个具有争议性的话题,但通常包括了统计学、信息学、数学,以及如今无法避免的计算机科学。在术语表达中,数据、计算、信息科学等通常是独立于域之外的存在。数据科学是统计学、网络分析、计算机和信息科学以及控制论等领域知识、实践和学科发展的综合产物,它的研究对象无处不在。域的作用是将某一专业领域与其他范畴区分开来。数据科学的目标之一是在各种科学之间以及科学与国家和工业之间建立起相互转换的关系,而这里的各类科学、国家、工业等都可以被视为域。在学术语境中,这些不同种类的域被称为学科边界。数据科学的目的并非消解这些域的存在,而是希望在不同域之间建立起基于数据的联系。虽然本文作者无法完全阐明域的实践逻辑,但他提供了域逻辑的三个分析起点:第一,域是边界划分的产物,却又旨在跨越边界。在域逻辑中,边界划分不只在于区分一个领域的内部和外部,而是为了提取出不同域之间的不同特征,并通过了解这些差异来更好地跨越边界构建联系。第二,域逻辑与多学科逻辑不可一概而论。域逻辑的一个重要特征是在离散的域之间定位一个中介对象。不同域之间并没有直接联系,他们之间的边界也并未被消解。可以说,域逻辑是在各个域保持原状态的情况下提取出它们之间的差异点。相反地,多学科逻辑则是指不同类别之间通过直接的相互学习和共享资源来进行协作。简言之,多学科逻辑希望弱化或消除边界,而域逻辑旨在跨越边界的同时保持差异。

     第三,域的一个显著特征是全息或分形。所谓分形,即指一个几何形状可以分成数个部分,而每个部分都至少近似地是整体缩小后的形状,广义来说,它形容一种自相似的性质。域拥有相似的逻辑。域可以存在于任何层次,例如“生物学”是一个域,而其下属的分支领域“基因流行病学”同样可以成为一个域。域以内嵌形式存在,通过深入探索一个域,可以挖掘出更多附属域的特征,这也就为数据科学中各学科合作提出了要求。刻画一个域可以是理解该域的数据或软件这样的技术型工作,也可以是勾勒该域的语言、文化、本体等社会学特征,为了进行以上探索,社会学家及其研究工具在域逻辑中发挥作用已有了数十年的历史。

     域逻辑中社会学(社会学家)的角色

     社会学家的这一角色在当今的数据科学领域中愈发活跃。在大型技术开发项目中,调查是了解未来用户群体(或域)的社会性、组织性和技术配置的主要查询工具。调查结果对指导计算系统下游设计起到一定作用。而这些调查项目的设计和部署通常离不开社会学家的参与。除了对域的实证研究,理论创新也是使得STS在数据和计算领域中占据一席之地的重要因素,特别是在构建域之间的中介关系时。在数据科学中有许多源自STS的概念例如交易区(Trading Zones)、人类基础设施(human infrastructure)等。其中最为著名的还属边界对象(boundary objects)这一概念。边界对象概念源于社会学和STS中业已成熟的象征性行动主义传统,最初是对行动者-网络理论提出一种独特的女权主义批判视角,此后越来越频繁的出现在与计算思维的对话中。数据研究者和信息科学家发现边界对象在计算系统中具有良好的可操作性,因为边界对象认为,只要存在一种中介物可以同时满足各方的信息需求,各个异质团体可以在继续各自原始运行轨迹的情况下进行合作。而这一概念完美地描述了域逻辑的理想状态。STS长期以来一直以多种方式参与到信息技术领域中,除了STS学者的直接参与或是在信息系统设计中采用STS概念,诸如人类学、问卷调查以及其他社会科学研究方法早在数十年前就已被纳入到对人为因素、用户体验或用户中心设计的讨论、课程和实践中。无论是社会学家的积极参与还是社会学概念和方法被广泛采纳,大量对人类、用户或社会技术系统的研究都证明了社会科学方法的重要性,也对社会科学应对域逻辑中更大的协作复杂性提出了挑战。

     越来越多的文章呼吁扩大对社会科学角色的理解,认为社会科学的作用远远超越了“为系统设计提供参考意见”的意义,希望社会科学能够做出更多贡献。这种需求对STS学者来说既是挑战也是机会。说是挑战,因为做出贡献是困难的,需要长时间的积累,而且很多时候会充当一种服务的角色。但同时也为STS学者提供了塑造新的社会技术景观的机会。

     STS该如何自我定位?如何参与数据科学?

     当下,在公众与数据的交叉口,存在着大量令人眼花缭乱的现象,例如数据安全、隐私泄露、情感操纵、监管不力等产生的后果。对社交媒体的关注有助于提高人们对日常生活中技术变革的重视。这些对于社会技术的批判性理解是那些关注数据下游后果的人来之不易的胜利。然而,仅仅关注社交平台数据或其他与公众直接相关的数据并不能恰当地认识数据科学的横向目标,数据科学的行动意图是开发新型计算工具,培养具有跨领域工作技能的专家,或是增强跨领域数据和资料的可获得性等。如果数据科学正在生成新的横向域间关系,那么为了理解这些关系,STS学者必须展示出同等的调查敏捷度,将自己置于关键的交叉领域,跟踪不同域之间数据、分析、工具和技术的横向运动。这些横向运动通常被定义为合作协调、学科差异、组织传播等。不论是作为功能性贡献者,还是对权力、包容性、代表性等坚持不懈的关注,人文社会学家长期以来都在通过在数据的查询、设计、政策制定等方面提供帮助来维护自己做出贡献的利基。这一利基确实为STS学者深入参与到数据科学的技术规划、开发和展示过程提供了现成的途径。当然,这些现成的途径是要付出代价来得到的,它们使社会学家处于一种服务性的地位。

     以本文作者的经验之谈来看,数据科学对社会科学的贡献往往存在一个预设的期望值,且对社会科学家的参与事先划定了界限。然而,如今数据科学对社会科学的需求远远超越了一个功能性的角色,这也正是STS学者的机会。

     要绘制一幅更广大的数据-科技-专业图景,STS学者一方面须将自身置于域内部,一方面要站在跨领域的交叉点中,探索赋予域独立性的新兴理论和技术核心。除了描述、展示理论化数据科学,STS学者还有机会通过指导技术设计和参与制造过程等方式塑造数据科学的产出结果。数据科学必然会继续超越技术领域的范畴,STS也必然将会与数据科学持续“纠缠”在一起。

     注:

     STS更详细的解释请见维基百科“science and technology studies”词条

     链接:

     https://en.wikipedia.org/wiki/Science_and_technology_studies

     原文:

     David Ribes(2019). STS, Meet Data Science, Once Again, Science,Technology and Human Values, 44(3), 514-539.

     原文链接:

     https://journals.sagepub.com/doi/full/10.1177/0162243918798899

     作者 | 清华大学新闻与传播学院研究生 李子玄

     审阅 | 金兼斌 徐雅倩

     编辑 | 袁 洁 尚雪芬

    

     点击上方“公众号”可以订阅哦!

    http://weixin.100md.com
返回 科学传播人 返回首页 返回百拇医药