Hình ảnh hóa / Trực quan hóa Văn bản

Do Lê Quang Văn thực hiện

Hình ảnh hóa hay Trực quan hóa văn bản là làm cho người dùng “thấy” được những gì ẩn chứa trong văn bản.
Người xưa đã từng nói “ý tại ngôn ngoại” (những điều hàm ý, không nói ra trực tiếp, người nghe/đọc phải tự suy ra mà hiểu lấy.) Phần lớn người dùng tài liệu không hiểu hoặc không nhìn thấy hết ý nghĩa của tài liệu.
Để giải quyết vấn đề này, trước đây chúng ta có những hình thức, như: ngâm thơ, diễn kịch, phổ nhạc, nhằm giúp người dùng hiểu rõ hơn ý nghĩa của tài liệu.
Tại trường, các thầy cô đã cố gắng trình bày tài liệu với nhiều chi tiết bổ sung để giúp người học hiểu rõ hơn. Tuy nhiên những tài liệu bổ sung này phần lớn xuất phát từ cá nhân, không đồng nhất và không được phổ biến rộng rãi.
Ngày nay máy tính với những phần mềm thích hợp, có thể giúp người dùng “thấy” được những gì ẩn bên trong văn bản.
Những phần mềm này có thể giúp số hóa văn bản (thí dụ danh sách từ = word list), từ đồng hiện (collocation), trình bày từ trong ngữ cảnh (concordance) và đặc biệt là hình ảnh hóa nội dung văn bản.
Trong trang Web này chúng tôi sẽ lần lượt trình bày những phương pháp hình ảnh hóa / trực quan hóa nội dung văn bản, với những phần mềm sau:
1 – Wordle – 2 – Word Tree – 3 – Voyant Tools – 4 – Sketch Engine


Hình ảnh hóa hay Trực quan hóa văn bản với Wordle


Hình ảnh hóa hay Trực quan hóa văn bản với Word Tree cho tiếng Việt

Trong hình trên, cột bên phải chứa tài liệu tham khảo, cột bên trái chứa từ trong ngữ cảnh, đặc biệt những từ đứng ở bên phải của từ quan tâm. Trong hình này, Word Tree liệt kê tất cả những câu có chứa từ “Thảm” và trong mỗi câu có thêm các từ ở bên phải của từ “Thảm”. Tính chất này rất quan trọng trong việc học các giới từ (preposition) tiếng Anh đứng sau động từ hay việc tìm tính từ (adjective) đứng sau danh từ, trong việc học tiếng Việt. Kích cỡ của từ tượng trưng cho tần suất của từ trong văn bản.


Hình ảnh hóa hay Trực quan hóa văn bản với Word Tree cho tiếng Anh

Trong hình trên từ quan tâm là “liberalism”. Muốn tham khảo từ quan tâm khác thì điền từ đó trong ô trên cùng (cạnh chữ Word Tree, đang được tô màu xanh).

  • Word Tree rất dễ dùng, không cần cài đặt.
  • Muốn đến trang web của Word Tree chỉ cần gõ Word Tree trong Google Search.
  • Khi ở trong trang web của Word Tree, chỉ cần paste văn bản vào khung bên dưới Paste Text; sau đó nhấn vào ô Generate WordTree! Trong vài giây sẽ có kết quả như hình trên.


Hình ảnh hóa hay Trực quan hóa văn bản với Word Tree cho tiếng Việt

Voyant Tools (Bộ công cụ Voyant) là một tập hợp của nhiều công cụ rất dễ dùng, có sẵn trên Internet, không cần phải cài đặt trên máy tính cá nhân. Tuy nhiên Voyant Tools có khá nhiều chức năng mà người dùng cần nắm vững trước khi sử dụng.

https://voyant-tools.org/?corpus=87ba2a488782292ced1fd56633ca0e0b

Hình ảnh hóa hay Trực quan hóa văn bản với Word Tree cho tiếng Việt (thêm tính năng khác)

https://voyant-tools.org/?corpus=eb2e1804086c4d315ec55081c5145c84
Một tính năng quan trọng và tiên tiến của Voyant Tools là trang Web do bạn thực hiện có thể dùng được bất cứ ai nếu bạn cho phép bằng cách cung cấp địa chỉ trang web liên hệ. Tính năng này rất hữu ích trong trường hợp các thầy cô muốn người học phải thực hiện một số thao tác trên trang vừa được tạo ra trong Voyant Tools.
Trong một tài liệu khác chúng tôi sẽ trình bày những ứng dụng của Voyant Tools trong nhiều lãnh vực bên ngoài Ngôn ngữ học.
Để biết thêm thông tin về vấn đề này, hãy tìm đọc sách Hình ảnh hóa hay Trực quan hóa văn bản do Lê Quang Văn thực hiện 2020.

Leave a Reply

Your email address will not be published. Required fields are marked *