AI nghĩ bạn là ai? Triển lãm mới đột phá này sẽ cho bạn thấy

Một cuộc triển lãm mới ở Milan phân tích lịch sử rắc rối của bộ dữ liệu học máy tập trung và cho phép cả khách truy cập trực tiếp và khách truy cập từ xa xem cách AI phân loại chúng.
1 /9 [Ảnh: Marco Cappelletti / Fondazione Prada]
BỞI KATHARINE SCHWAB6 PHÚT ĐỌC
Năm 2009, một nhóm các nhà khoa học tại Stanford và Princeton muốn dạy máy tính cách nhận biết bất kỳ vật thể nào trên thế giới. Để làm điều đó, họ cần rất nhiều hình ảnh Hình ảnh của mèo và chó, táo và dĩa và thìa, nhưng cũng có hình ảnh của con người. Những bức ảnh này, mỗi bức ảnh được gắn thẻ một danh mục, sau đó có thể được hiển thị cho thuật toán học máy sẽ dần dần học theo cách phát hiện các ngạnh nhọn của một cái nĩa từ các đường cong mềm mại của một cái muỗng.

Các nhà nghiên cứu đã xây dựng một bộ dữ liệu gồm hơn 14 triệu hình ảnh, tất cả được tổ chức thành hơn 20.000 loại, với trung bình 1.000 hình ảnh cho mỗi loại. Nó đã trở thành dữ liệu nhận dạng đối tượng được trích dẫn nhiều nhất trên thế giới, với hơn 12.000 trích dẫn trong các tài liệu nghiên cứu.

[Ảnh: Marco Cappelletti / Fondazione Prada]
Nhưng ImageNet, như tập dữ liệu được biết đến, không chỉ bao gồm các đối tượng: Nó cũng có gần 3.000 danh mục dành riêng cho mọi người, bao gồm một số được mô tả với các thuật ngữ tương đối vô hại, như trinh sát cổ vũ của cậu bé hay cậu bé trinh sát.

Nhưng nhiều mô tả được chỉ định, được cộng đồng sử dụng nhân công thông qua nền tảng Mechanical Turk của Amazon, rất đáng lo ngại. Người xấu, người đạo đức, người ăn thua, người nghiện ma túy mà không có sự đồng ý của họ. Đáng sợ hơn, ImageNet cũng có các thể loại như các công nhân và các nhà lãnh đạo của Hồi giáo, và đó là các thể loại lịch sử xã hội trông khác nhau giữa các nền văn hóa khác nhau nếu chúng tồn tại. Không có cách nào để biết ai thực sự dán nhãn cho mỗi hình ảnh, hãy để một mình đánh giá những thành kiến cá nhân của mỗi người có thể đã thông báo cho các nhãn.

Kate Crawford và Trevor Paglen [Ảnh: Marco Cappelletti / Fondazione Prada]
ImageNet và lịch sử của các loại tập dữ liệu đào tạo khác, xuất hiện từ những năm 1960, là chủ đề của một triển lãm mới tại Quỹ Prada ở Milan. Triển lãm, Đào tạo con người , được giám tuyển bởi Trevor Paglen và giáo sư và nhà nghiên cứu Kate Crawford . Nó cho thấy các bức ảnh tạo nên các bộ dữ liệu như ImageNet, cho khách truy cập một cái nhìn thoáng qua vào các hình ảnh cung cấp năng lượng cho hệ thống nhận diện khuôn mặt và nhận dạng khuôn mặt.

ImageNet đặc biệt có phòng riêng trong phòng trưng bày, nơi các bức ảnh của mọi người được dán vào thẻ nơi in nhãn thể loại của họ và được ghim vào tường. Danh mục thẻ khoa học lặp lại trong quá khứ, giống như côn trùng được gắn vào thẻ với tên khoa học của họ .

Đối với những người không thể truy cập Milan, Crawford và Paglen đã tạo ra một công cụ trực tuyến có tên ImageNet Roulette , được đào tạo về các loại phân loại con người của ImageNet. Nó cho phép bạn chụp ảnh bằng webcam, sử dụng liên kết hoặc tải lên bất kỳ hình ảnh nào của một người và sau đó nó cung cấp cho bạn phân loại chủ đề của ImageNet.

[Ảnh: Marco Cappelletti / Fondazione Prada]
Paglen và Crawford đã giới thiệu công cụ tại hội nghị South by Southwest ở Austin đầu năm nay với những bức ảnh của riêng họ và của Leif Ryge, nhà phát triển trong studio của Paglen, người đã tạo ra nó. Hình ảnh của Paglen được phân loại là thành Klansman. Headshot của Crawford thu hút được nữ anh hùng phân loại. Những hình ảnh khác về Ryge đã quay trở lại với tư cách là creep, người vô gia cư, là người vô gia cư

[Ảnh: lịch sự của tác giả]

[Ảnh chụp màn hình: lịch sự của tác giả]
Khi tôi tự thử nó bằng webcam máy tính của mình, ImageNet đã quyết định rằng tôi là một nhà tâm lý học ngôn ngữ. Không rõ tại sao.
Nói chung, tôi nghĩ rằng việc kinh doanh phân loại con người nói chung là thứ gì đó xứng đáng với sự xem xét kỹ lưỡng hơn nhiều so với nó được đưa ra, ông Pag Paglen nói.

Paglen chỉ ra lịch sử đen tối của việc đưa con người vào các thể loại trong các thế kỷ trước, như trong thời kỳ phân biệt chủng tộc ở Nam Phi: Một tập gọi là Sách Sự sốngphân loại những người dựa trên nền tảng chủng tộc của họ, và được sử dụng để xác định nơi mọi người có thể sống, những công việc họ có thể giữ và nơi con cái họ có thể đi học. Ông cũng ví sự phát triển của học máy và nhận thức của mọi người rằng các thuật toán của nó là khách quan đối với lịch sử nhiếp ảnh vào cuối thế kỷ 19 và đầu thế kỷ 20, trong đó nhiều người cho rằng những hình ảnh mới lạ này vốn là trung tính. Kết hợp với sự phát triển của chủ nghĩa Darwin xã hội, trong đó phổ biến ý tưởng rằng một số nền văn hóa và dân tộc tiến hóa vượt trội so với những người khác, nhiếp ảnh đã giúp tạo ra các lĩnh vực giả khoa học mới. Phrenology, trong đó thiếu bất kỳ cơ sở nào trong thực tế và phân biệt chủng tộc sâu sắc, đã cố gắng đo lường sự khác biệt về thể chất giữa những người thuộc các chủng tộc khác nhau. Các nhà khoa học cũng cố gắng buộc ngoại hình của mọi người vào hành động của họ: chụp ảnh Khi nhiếp ảnh được phát minh,

Như chúng ta biết ngày nay rằng nhiếp ảnh là chủ quan và phrenology là vô lý, Paglen và Crawford hy vọng sẽ phơi bày sự thật về các hệ thống AI ngày nay, làm suy yếu niềm tin phổ biến rằng chúng bằng cách nào đó trung lập bởi vì chúng được xây dựng bằng toán học.

Bất kể bạn xây dựng một hệ thống như thế nào, đó là đàn ông, phụ nữ, trẻ em, người da đen, người châu Á trông như thế nào, bạn luôn đến với một loại hình tổ chức phân loại luôn luôn sẽ trở thành chính trị, ông nói, Crawford, người đồng thời là người đồng sáng lập và là người viết mã của Viện AI Now tại NYU . Càng luôn có sự chủ quan với nó và cách nhìn được tích hợp vào nó.

Triển lãm có thể là lần đầu tiên nhiều người nhìn thoáng qua những hình ảnh làm nền tảng cho các hệ thống thuật toán. Nhưng một số hình ảnh quan trọng nhất bị thiếu. Mặc dù Đào tạo Con người bao gồm các bộ dữ liệu là nguồn mở hoặc có sẵn để sử dụng cho nghiên cứu, nhưng nó loại trừ hình ảnh khỏi một số bộ dữ liệu mạnh nhất trong thời đại của chúng ta, như vô số hình ảnh khổng lồ của Facebook.

Crawford cũng muốn nhấn mạnh rằng nguồn gốc của các hệ thống công nghệ phức tạp này bắt nguồn từ những hình ảnh trần tục từ cuộc sống hàng ngày của mọi người.

Đây không phải là những hệ thống toán học trừu tượng tuyệt vời mà không ai có thể hiểu được. Đây là chất liệu của cuộc sống hàng ngày của chúng ta [mà] đã được đưa vào các hệ thống lớn này để giúp AI trở nên tốt hơn trong việc nhận diện khuôn mặt, tại 'phát hiện cảm xúc.'

Nhưng điều đó không làm cho chúng vô hại. Nhận dạng khuôn mặt rất gây tranh cãi và nhận dạng cảm xúc đang bắt đầu được các nhà khoa học gỡ lỗi .

[Ảnh: Marco Cappelletti / Fondazione Prada]
Một trong những bộ dữ liệu được đưa vào triển lãm là bộ dữ liệu Biểu hiện khuôn mặt nữ Nhật Bản từ năm 1997, có 213 hình ảnh của sáu biểu cảm trên khuôn mặt được cho là tương ứng với trạng thái cảm xúc bên trong, niềm vui, bất ngờ, buồn bã, tức giận và sợ hãi Nhà thờ với khuôn mặt trung tính. Crawford chỉ ra nó như một ví dụ về cách sử dụng sáu loại để nói lên sự giàu có và chiều sâu của cảm xúc con người chỉ đơn giản là không đủ và đặc quyền cho một cái nhìn đơn giản về cách loài người trải nghiệm thế giới. Một bộ dữ liệu khác gọi là FERET, được CIA tài trợ vào cuối những năm 1990, đã sử dụng hình ảnh của các nhà nghiên cứu, trợ lý phòng thí nghiệm và người lao công làm việc tại Đại học Texas tại phòng thí nghiệm Austin để đào tạo các thuật toán để phát hiện khuôn mặt của mọi người.

[Ảnh: Marco Cappelletti / Fondazione Prada]
Mặc dù nhiều bộ dữ liệu học máy rất thiếu sót, dù sao chúng cũng được triển khai bởi cả các nhà nghiên cứu hàn lâm và các công ty. Nhưng Crawford có một số ý tưởng về cách các thiên kiến vốn có của bộ dữ liệu có thể được phân loại tốt hơn để khi các nhà khoa học AI trong tương lai sử dụng chúng, ít nhất họ cũng nhận thức được các vấn đề.
Năm 2018, cô hợp tác với tám nhà nghiên cứu khác trong một dự án tạo nhãn cho các bộ huấn luyện bao gồm thông tin về hình ảnh đến từ đâu, phân chia nhân khẩu học là gì (nếu là hình ảnh của mọi người), người đã tạo ra bộ ảnh, nếu hình ảnh các đối tượng đã đồng ý, bất kỳ mối quan tâm riêng tư và mục đích ban đầu của bộ dữ liệu (trong số những người khác). Các bảng dữ liệu này cho các bộ dữ liệu, đã có một số ứng dụng trong ngành, mặc dù đó là một bước rất nhỏ để các nhà nghiên cứu hiểu được ý nghĩa của dữ liệu AI của họ.

Đối với Paglen, câu hỏi về những gì có thể được thực hiện để làm cho các bộ đào tạo học máy ít đơn giản hơn và không chính xác là lớn hơn. Bởi vì ông tin rằng công nghệ không bao giờ có thể là trung lập, ông nghĩ rằng các nhà thiết kế của các hệ thống này nên đặt câu hỏi liệu phân loại con người có thực sự là một phần của công việc họ muốn làm hay không.

Bạn muốn sống ở thế giới nào? anh ta nói. Đây là câu hỏi đầu tiên.

Tìm kiếm Blog này

Thiết kế tinh vi

AI nghĩ bạn là ai? Triển lãm mới đột phá này sẽ cho bạn thấy

Nhận xét

Đăng nhận xét