logo

  • Trang chủ
  • Giới thiệu
    • Thư ngỏ
    • Khái quát về Trung tâm
    • Nhân lực Trung tâm
      • Thành viên Trung tâm
      • Cộng tác viên
    • Giới thiệu Khoa Văn hóa học
      • Khái quát về Khoa
      • Nhân lực của Khoa
  • Tin tức
    • Tin nhà (Trung tâm)
    • Tin ngành
    • Tin liên quan
  • Đào tạo - Huấn luyện
    • Các chương trình
    • Tổ chức và Hiệu quả
    • Đào tạo ở Khoa VHH
      • Chương trình đào tạo
      • Kết quả đào tạo
  • Nghiên cứu
    • Lý luận văn hóa học
      • LLVHH: Những vấn đề chung
      • VHH: Phương pháp nghiên cứu
      • VHH: Các trường phái - trào lưu
      • Loại hình và phổ quát văn hóa
      • Các bình diện của văn hóa
      • Văn hóa học so sánh
      • Vũ trụ quan phương Đông
      • Văn hóa và phát triển
      • VHH và các khoa học giáp ranh
    • Văn hóa Việt Nam
      • VHVN: Những vấn đề chung
      • Văn hóa cổ-trung đại ở Viêt Nam
      • Văn hóa các dân tộc thiểu số
      • Văn hóa Nam Bộ
      • Văn hóa nhận thức
      • Văn hóa tổ chức đời sống tập thể
      • Văn hóa tổ chức đời sống cá nhân
      • Văn hóa ứng xử với môi trường tự nhiên
      • Văn hóa ứng xử với môi trường xã hội
    • Văn hóa thế giới
      • VH Phương Đông: Những vấn đề chung
      • VH Phương Tây: Những vấn đề chung
      • Quan hệ văn hóa Đông - Tây
      • Văn hóa Trung Hoa và Đông Bắc Á
      • Văn hóa Đông Nam Á
      • Văn hóa Nam Á và Tây Nam Á
      • Văn hóa châu Âu
      • Văn hóa châu Mỹ
      • Văn hóa châu Phi và châu Úc
    • Văn hóa học ứng dụng
      • VHƯD: Những vấn đề chung
      • VHH nghệ thuật
      • Văn hóa đại chúng
      • Văn hóa giao tiếp
      • Văn hóa du lịch
      • Văn hóa đô thị
      • Văn hóa kinh tế
      • Văn hóa quản trị
      • Văn hóa giáo dục - khoa học
    • Tài liệu phổ cập VHH
      • Văn hóa Việt Nam
      • Văn hóa thế giới
      • VHH ứng dụng
    • Tài liệu tiếng nước ngoài
      • Theory of Culturology
      • Vietnamese Culture
      • Applied Culturology
      • Other Cultures
      • 中文
      • Pусский язык
    • Thư Viện Số (Sách - Ảnh - Video)
      • Tủ sách Văn hoá học
      • Thư viện ảnh
      • Thư viện video
    • Các nhà văn hóa học nổi tiếng
  • Tiện ích
    • Dịch vụ Văn hóa học
    • Dịch vụ ngoài VHH
    • Trợ giúp vi tính
    • Từ điển Văn hóa học
    • Thư viện TT và Khoa
    • Tổng mục lục website
    • Tủ sách VHH Sài Gòn
    • Giải đáp thắc mắc
  • Thư giãn VHH
    • Văn chương Việt Nam
    • Văn chương nước ngoài
    • Nghệ thuật Việt Nam
    • Nghệ thuật thế giới
    • Hình ảnh vui
    • Video vui
  • Diễn đàn
  • Liên hệ
  • Trang chủ
  • Nghiên cứu
  • Lý luận văn hóa học
  • Văn hóa và phát triển
Tuesday, 21 April 2020 15:05

Rob Mitchum. Phát triển AI để hỗ trợ đọc ngôn ngữ cổ

Người post bài:  Nguyễn Thị Tuyết Ngân

Additional Info

  • Tiêu đề:

    PHÁT TRIỂN AI ĐỂ HỖ TRỢ ĐỌC NGÔN NGỮ CỔ

  • Tác giả:

    Rob Mitchum

  • Chức danh:

    Tuấn Quangdịch

Rob Mitchum. Phát triển AI để hỗ trợ đọc ngôn ngữ cổ

25 thế kỷ trước, mọi “tư liệu giấy tờ” của triều đình Achaemenid tại Đế quốc Ba Tư đều được ghi lại trên các tấm đất sét – và hàng vạn tấm trong số đó đã được các nhà khảo cổ học tại Viện Phương Đông thuộc Đại học Chicago – Hoa Kỳ, phát hiện nguyên vẹn vào năm 1933. Qua nhiều thập kỷ, các nhà nghiên cứu đã bỏ ra nhiều công sức để tìm hiểu và phiên dịch nội dung từng văn bản cổ này. Tuy vậy, quá trình phiên dịch thủ công thường rất khó khăn, kéo dài và thường dễ mắc lỗi.

Persepolis1380 0

Kể từ thập niên 1990, công việc của các nhà khoa học đã có thêm sự hỗ trợ của máy tính – dù không nhiều thành công, một phần bởi vì tính chất ba chiều của văn bản trên đất sét và sự phức tạp của hệ thống chữ hình nêm. Nhưng mới đây, một đột phá công nghệ của ĐH Chicago có thể cuối cùng tạo chìa khóa mở ra khả năng phiên dịch tự động các văn bản này, cũng như cho phép các nhà khoa học có thể rảnh tay thực hiện các phân tích sâu hơn. Qua đó, giúp chúng ta hé mở thêm nhiều thông tin về lịch sử, xã hội và ngôn ngữ thời Achaemenid.

Dự án DeepScribe được thành lập vào năm 2019 với sự cộng tác giữa các chuyên gia của Viện Phương Đông (OI) và Khoa Khoa học Máy tính và nhận được tài trợ từ Trung tâm Dữ liệu và Tin học – ĐH Chicago (CDAC). Khởi đầu với bộ dữ liệu gồm 6000 hình ảnh từ Kho lưu trữ thành cổ Persepolis dùng để “huấn luyện” cho AI, dự án sẽ xây dựng một mô hình học máy có thể “đọc” các tấm đất sét trong bộ sưu tập, và có thể sẽ cho ra đời một công cụ cho phép các nhà khảo cổ học ứng dụng với các loại ngôn ngữ cổ khác.

“Nếu chúng ta có thể xây dựng được một công cụ vừa linh hoạt vừa có thể ứng dụng rộng rãi cho các hình thức chữ viết và thời đại khác nhau, đó sẽ trở thành bước ngoặt lớn trong giới nghiên cứu,” PGS. Susanne Paulus, chuyên gia Assyria học tại ĐH Chicago, nói.

Dự án DeepScribe được thai nghén khi Paulus, Sandra Schloen và Miller Prosser từ OI có cuộc gặp gỡ với phó giáo sư Sanjay Krishnan trong một sự kiện về nghiên cứu nhân văn số. Schloen và Prosser có vai trò quản lý OCHRE, một cơ sở dữ liệu trực tuyến của Viện tập hợp và sắp xếp tư liệu của các cuộc khai quật khảo cổ và các hoạt động nghiên cứu khác. Trong khi đó, Krishman nghiên cứu ứng dụng kỹ thuật AI và học sâu vào phân tích các hình thức dữ liệu phức tạp. Sự tương hợp giữa hai phía sau đó đã dọn đường cho khả năng hợp tác.

DeepScribe Secondary 1

“Rất thú vị khi nhìn từ điểm nhìn thị giác máy tính (computer vision) vì đây là những thách thức mà tất cả chúng tôi cùng đối mặt. Ngành thị giác máy tính trong 5 năm qua đã tiến bộ vượt bậc; mà nếu 10 năm trước thôi chúng tôi sẽ không thể đạt được bước tiến như bây giờ.” PGS. TS Krishnan nói, “Đây là một vấn đề học máy rất hay, vì khi lấy chính xác làm mục tiêu, chúng tôi hưởng lợi từ việc có một bộ mẫu có hệ thống để luyện tập và có hiểu biết rất kỹ càng về [đối tượng nghiên cứu] là văn tự [hình nêm]. Vậy nên đây không phải là vấn đề chưa từng được biết đến.”

Bộ dữ liệu được dùng để huấn luyện cho AI được lấy từ kết quả nghiên cứu suốt 80 năm của các nhà khoa học Viện và ĐH Chicago, cũng như dự án gần đây nhằm số hóa bộ sưu tập văn bản đất sét bằng ảnh chụp có độ phân giải cao – với khối lượng hiện đã lên đến 60 terabyte và vẫn tiếp tục mở rộng – trước khi chúng được trả về Iran. Tận dụng bộ sưu tập này, các nhà khoa học đã biên soạn một từ điển tiếng Elamite viết trên các tấm sét, cũng như cho sinh viên hỗ trợ xây dựng một bộ dữ liệu gồm hơn 100 nghìn “điểm nóng” hay là các dấu hiệu riêng đã xác định.

Với những nguồn lực của Trung tâm Máy tính UChicago, Krishnan đã sử dụng dữ bộ dữ liệu này để huấn luyện một mô hình học máy mới tương tự như mô hình sử dụng ở các dự án thị giác máy tính khác. Khi thử nghiệm với các tấm sét không nằm trong bộ dữ liệu gốc, mô hình này có thể phiên dịch các ký tự hình nêm với độ chính xác lên đến 80%. Giai đoạn nghiên cứu tiếp theo sẽ xem xét vấn đề của 20% sai số để tìm cách nâng độ chính xác lên cao hơn nữa.

Nhưng hiện tại thì với độ chính xác 80%, mô hình này cũng có thể giúp ích rất nhiều cho việc đọc. Nội dung của nhiều tấm sét thực ra chỉ ghi chép hoạt động mua bán, giống như “một tập hóa đơn siêu thị vậy”, theo PGS.TS Paulus. Và trên thực tế thì một hệ không được bổ sung thêm vào “bộ não” của chúng thì hệ đó vẫn hữu dụng.

Cũng theo PGS. TS Paulus: “Nếu như máy tính có thể phiên dịch và xác định ra những đoạn thông tin lặp đi lặp lại và để lại cho các chuyên gia các đoạn phức tạp như tên địa danh, động từ, hay các từ cần giải nghĩa… thì cũng đã rất được việc rồi.”

“Còn nếu như máy tính không thể quyết định cách đọc văn bản, nó vẫn có thể gửi về cho chúng ta các phương án khả thi nhất hay xác suất – như vậy cũng là một khởi đầu tốt cho nhà nghiên cứu. Điều đó rất tuyệt vời.”

Tham vọng lớn hơn của nhóm là sẽ biến DeepScribe thành một công cụ đọc và phiên dịch đa năng mà họ có thể chia sẻ với các nhà khảo cổ khác. Ví dụ như mô hình hiện tại có thể được huấn luyện lại cho các ngôn ngữ sử dụng văn tự hình nêm khác ngoài tiếng Elamites; hoặc huấn luyện để tự động hoàn thiện các nội dung văn bản bị khuyết thiếu. Một mô hình học máy như vậy còn có thể giúp xác định niên đại hay nguồn gốc của tấm sét hay các hiện vật khác, vấn đề vốn trước nay phải dựa vào phân tích hóa học.

Các dự án tương tự do CDAC tài trợ đang sử dụng tiếp cận thị giác máy tính cho nhiều hướng ứng dụng khác nhau, trng đó có nghiên cứu đa dạng sinh học và nghiên cứu tác phẩm nghệ thuật. Những hợp tác trong dự án này cũng hy vọng sẽ truyền cảm hứng cho nhiều sự hợp tác trong tương lai, khi khảo cổ học kỹ thuật số ngày càng đến gần hơn các phương pháp tính toán tiên tiến.

Nguồn: http://news.uchicago.edu/story/how-ai-could-help-translate-written-language-ancient-civilizations

https://tiasang.com.vn/

Lên trên

Cùng chủ đề

  • Bùi Hoài Sơn. Hoàn thiện thể chế văn hoá đáp ứng yêu cầu phát triển bền vững đất nước

  • Michel Dubois. Covid-19: Niềm tin của công chúng vào khoa học?

  • Michael J. Green. Ba kịch bản địa chính trị châu Á sau Covid-19

  • David Balaam & Michael Veseth. Của cải và quyền lực: Chủ nghĩa trọng thương và chủ nghĩa dân tộc kinh tế

  • Nguyễn Thụy Phương. Nguồn gốc luận thuyết của "sứ mệnh khai hóa"

Thông báo

Tư vấn khoa học và kỹ năng nghiên cứu…

Tủ sách văn hoá học Sài Gòn

  • Thư viện ảnh
  • Thư viện video
  • Tủ sách VHH

Phóng sự ảnh: Toạ đàm khoa học: Xây dựng…

Hình ảnh văn hóa Tết xưa (sưu tầm)

Phóng sự ảnh: Lễ hội truyền thống VHH 2011

Phóng sự ảnh Lễ hội truyền thống VHH 2010

Thành phố Sankt-Peterburg, Nga

Bộ ảnh: Việt Nam quê hương tôi 2

Tranh Bùi Xuân Phái

Bộ tem tượng Phật chùa Tây Phương

Bộ ảnh: Đá cổ Sapa

Bộ ảnh: Phong cảnh thiên nhiên

Bộ ảnh: Việt Nam quê hương tôi

"Biển, đảo Việt Nam - Nguồn cội tự bao đời":…

Con dê trong văn hóa và văn hóa Việt Nam

Văn hóa Tết ở Tp.HCM (Chương trình truyền…

Văn hóa Tp. HCM: Một năm nhìn lại và động…

Phong tục Tết cổ truyền của người Nam Bộ

Bánh tét và Tết phương Nam

Con ngựa trong văn hóa và văn hóa Việt Nam

Điện Biên Phủ - Cuộc chiến giữa hổ và voi

Nhìn lại toàn cảnh thế giới từ 1911-2011…

Tọa độ chết - một bộ phim Xô-Việt xúc động…

Video: Lễ hội dân gian Việt Nam

Văn hoá Việt từ phong tục chúc Tết

Văn hoá Tết Việt qua video

Tết ông Táo từ góc nhìn văn hoá học

“Nếp nhà Hà Nội” trên “Nhịp cầu vàng”: tòa…

Văn hóa Thăng Long - Hà Nội qua video: từ…

Hướng về 1000 năm TL-HN: Xem phim “Tử Cấm…

Hướng về 1000 năm TL-HN: Người Thăng Long…

Phim "Chuyện tử tế" – tập 2 (?!) của “Hà…

Default Image

Hướng về 1000 năm TL-HN: "Chuyện tử tế" -…

Sách “Di sản Ấn Độ trong văn hóa Việt Nam”

Nguyễn Văn Bốn. Tín ngưỡng thờ Mẫu của người…

Sách: Quản lý và khai thác di sản văn hóa…

Hồ Sĩ Quý. Con người và phát triển con người

Alonzo L. Hamby. Khái quát lịch sử Mỹ. Phần 3

Alonzo L. Hamby. Khái quát lịch sử Mỹ. Phần 2

Alonzo L. Hamby. Khái quát lịch sử Mỹ. Phần 1

Hồ Sỹ Quý. Tiến bộ xã hội: một số vấn đề về…

Hồ Sỹ Quý. Về Giá trị và Giá trị Châu Á (Phụ…

Hồ Sỹ Quý. Về Giá trị và Giá trị Châu Á…

Hồ Sĩ Quý. Về Giá trị và Giá trị Châu Á…

Sách: Chuyên đề Văn hoá học

Sách: Một số vấn đề về hệ giá trị Việt Nam…

FitzGerald. Sự bành trướng của Trung Hoa…

Hữu Đạt. Đặc trưng ngôn ngữ và văn hoá giao…

Sống chụ son sao (Tiễn dặn người yêu)

Gs. Mai Ngọc Chừ. Số phận & Tâm linh

Trần Văn Cơ. Những khái niệm ngôn ngữ học…

Đoàn Văn Chúc. Văn hóa học (Phần 3 - hết)

Đoàn Văn Chúc. Văn hóa học (Phần 2)

Các nhà VHH nổi tiếng

Julian Haynes Steward

Wen Yi'duo (Văn Nhất Đa)

Leslie Alvin White

Huang Wen'shan (Hoàng Văn Sơn)

Radcliff-Brown, Alfred Reginald

Sapir, Edward

Margaret Mead

Thăm dò ý kiến

Bạn thích cuốn "Cơ sở văn hoá VN" của tác giả nào nhất?

Chu Xuân Diên - 4.8%
Lê Văn Chưởng - 0.9%
Trần Diễm Thuý - 1%
Trần Ngọc Thêm - 37.4%
Trần Quốc Vượng - 53%
The voting for this poll has ended on: 26 06, 2020

Tổng mục lục website

tong muc luc

Tủ sách VHH Sài Gòn

tu sach VHH SG

Thống kê truy cập

  • Đang online :
  • 475
  • Tổng :
  • 3 7 7 3 3 8 3 4
  • Đại học quốc gia TPHCM
  • Đại học KHXH&NV
  • Tran Ngoc Them
  • T.c Văn hóa-Nghệ thuật
  • Tc VHDG
  • Viện NCCN
  • Khoa Văn hóa học
  • Khoa Đông phương học
  • Phòng QLKH
  • Khoa Việt Nam học
  • Khoa Hàn Quốc học
  • BM Nhật Bản học
  • Khoa Văn học - Ngôn ngữ
  • Khoa triết học
  • Khoa Quan hệ quốc tế
  • Khoa Xã hội học
  • Bảo tàng Lịch sử - Văn hóa
  • viettems.com
  • myfaifo.com
Previous Next Play Pause

vanhoahoc.vn (các tên miền phụ: vanhoahoc.edu.vn ; vanhoahoc.net)
© Copyright 2007-2015. Bản quyền thuộc Trung tâm Văn hóa học Lý luận và Ứng dụng, Trường Đại học KHXH & NV - ĐHQG Tp. HCM
ĐT (028) 39104078; Email: ttvanhoahoc@hcmussh.edu.vn; ttvanhoahoc@gmail.com. Giấy phép: số 526/GP-BC, do Bộ Thông tin và Truyền thông cấp ngày 27-11-2007
Ghi rõ nguồn vanhoahoc.vn khi phát hành lại các thông tin từ website này.

Website được phát triển bởi Nhà đăng ký tên miền chính thức Việt Nam trực thuộc Trung Tâm Internet VNNIC.

Văn hóa và phát triển