4. 1.1 TRADITIONAL ARCHIVES VS DIGITAL ARCHIVES
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 4
(modified from Spiteri, 2014)
The specific characters
of digital record
• Cannot divided as
tangible (i.e.
physical records) or
intangible (i.e.
digital records)
• Record lifecycle is
not cover circuit of
digital record.
9. 2.1 อะไรคือ DIGITAL CURATION ?
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 9
Source: https://www.youtube.com/watch?v=6cuOdgvYRGM
10. 2.2 DEFINITIONS
Lee & Tibbo, 2007
• “Digital curation involves the management of digital objects
over their entire lifecycle, ranging from pre-creation activities
wherein systems are designed, and file formats and other
data creation standards are established, through ongoing
capture of evolving contextual information for digital assets
housed in archival repositories”
Harvey, 2010
• “Digital curation is a more inclusive concept than either digital
archiving or digital preservation. It addresses the whole range
of process applied it digital objects over their life cycle. Digital
curation begins before digital objects are created by setting
standards for planning data collection that results in “curation
ready” digital objects that are in the best possible condition to
ensure that they can be maintained and used in the future”
DCC, n.d.
• “Digital curation involves maintaining, preserving and adding
value to digital research data throughout its lifecycle”
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 10
11. 2.3 AIMS AND SCOPE
Longevity
ไม่เกิดความเปลี่ยนแปลงเมื่อมี
การอพยพข้อมูล
สามารถตรวจสอบความถูกต้อง
ของการอพยพข้อมูลได้
Metadata สามารถอพยพ
ตามไปได้
ระบุรายละเอียดความ
เปลี่ยนแปลงของ
Hardware, Software,
file formats, standard
ที่จะมีผลต่อกระบวนการสงวน
รักษาวัสดุดิจิทัลได้
Integrity
ตรวจสอบความถูกต้องในการ
อพยพ
Metadata ที่ให้รายละเอียด
ข้อมูลสามารถอพยพตามไปด้วย
ยังรักษาสาเนาของ bit
stream เอาไว้ได้
ยังรักษาสิทธิ์ในทรัพย์สินทาง
ปัญญา และสิทธิ์อื่นๆ ไว้ได้
Accessibility
ยังรักษาความสามารถในการระบุสถานที่
จัดเก็บวัสดุดิจิทัลได้
รักษา Representation
information (structure and
semantic information) ของวัสดุ
ดิจิทัลเอาไว้ได้ เพื่อที่ข้อมูลเหล่านี้จะ
สามารถเข้าใจได้ในอนาคต
สร้างวัสดุดิจิทัลบนพื้นฐานของ open
standards หรือ standard
formats
จากัดรูปแบบของการสงวนรักษาที่จาเป็น
ต้อการจัดการให้ธารงไว้ซึ่งการเข้าถึง
สามารถให้รายละเอียดความ
เปลี่ยนแปลงของ Hardware,
Software, file formats,
standard ที่จะมีผลต่อกระบวนการ
สงวนรักษาวัสดุดิจิทัลได้
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 11
12. 2.4 BENEFITS
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 12
•ช่วยพัฒนาคุณภาพในการเข้าถึงข้อมูล ซึ่งจะนาไปสู่การสร้างความต่อเนื่อง ความเร็วในการเข้าถึง
และทาให้แน่ใจได้ว่าข้อมูลจะยังเข้าถึงได้ในระยะยาว
1. Improving access
•ช่วยพัฒนาคุณภาพของข้อมูลให้มีความน่าเชื่อถือมากขึ้น และสามารถนาไปใช้งานทางกฎหมายได้
2. Improving data quality
•ช่วยส่งเสริมให้เกิดการแบ่งปันและใช้ซ้าข้อมูลได้ เนื่องจากการใช้มาตรฐานข้อมูลเดียวกัน รวมถึง
ระบุข้อมูลเกี่ยวกับบริบทและแหล่งที่มาของข้อมูลอย่างเหมาะสม ได้ช่วยส่งเสริมให้เกิดการแบ่งปัน
และใช้ซ้าข้อมูลตลอดช่วงชีวิต
3. Encourage data sharing and reuse
•ช่วยอนุรักษ์และป้ องกันข้อมูลจากความล้าสมัยทางเทคโนโลยี และการสูญหายข้องข้อมูล
4. Protecting data
(Harvey, 2010, p. 12)
13. 2.5 DCC LIFECYCLE MODEL
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 13
Datais “any
information in binary
digital form”. This
includes:
• Simple digital objects
• Complex digital
objects
• Database
(DCC, 2008)
14. 2.6 ACTIONS IN DCC LIFECYCLE MODEL
Action 1: Full
Lifecycle Actions
• Description and
Representation
Information
• Preservation
Planning
• Community Watch
and Participation
• Curation and
Preservation
Action 2:
Sequential
Actions
• Conceptualise
• Create or Receive
• Appraise and
Select
• Ingest
• Preservation action
• Store
• Access and reuse
• Transform
Action 3:
Occasional
Actions
• Dispose
• Reappraisal
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 14
16. SOURCES FOR CONCEPTUALISE
• Checklist for conceptualization:
http://www.dcc.ac.uk/sites/default/files/documents/Conceptualisation Checklist.pdf
• Data plan guidance and examples:
http://www.dcc.ac.uk/resources/data-management-plans/guidance-examples
• DMPonline:
https://dmponline.dcc.ac.uk/
• DMPTool
https://dmp.cdlib.org/
• MANTRA Research Data Management Training:
http://datalib.edina.ac.uk/mantra/
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 16
21. SOURCES FOR CREATE OR RECEIVE
• Checklist for create or receive:
http://www.dcc.ac.uk/sites/default/files/documents/Create Checklist.pdf
• Using Metadata Standards:
http://www.dcc.ac.uk/resources/briefing-papers/standards-watch-
papers/using-metadata-standards
• What are Metadata Standards:
http://www.dcc.ac.uk/resources/briefing-papers/standards-watch-
papers/what-are-metadata-standards
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 21
23. SOURCES FOR APPRAISE AND SELECT
• Checklist for appraise and select:
http://www.dcc.ac.uk/sites/default/files/documents/Select and Appraise Checklist.pdf
• Data Asset Framework: Implementation Guide:
http://www.dcc.ac.uk/sites/default/files/documents/DAF_Implementation_Guide[1].pdf
• Five steps to decide what data to keep:
http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
• แบบสารวจกระบวนการจัดการข้อมูลดิจิทัลของผู้ปฏิบัติงาน ศมส.
https://www.surveymonkey.net/r/Preview/?sm=ro_2FKFZeib1quHWcpAtb_2B_2B7klsc
x73T3MePGTqLpCZL_2FncDEtTdXZcVnfo8XFjx_2F5
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 23
25. SOURCES FOR INGEST
• Checklist for ingest and store:
http://www.dcc.ac.uk/sites/default/files/documents/Ingest and Store Checklist.pdf
• erpaGuidance – Ingest Strategies :
http://www.dcc.ac.uk/sites/default/files/documents/ERPANETIngestTool[1].pdf
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 25
27. SOURCES FOR PRESERVATION ACTION
• Checklist for preservation action:
http://www.dcc.ac.uk/sites/default/files/documents/Preservation Action Checklist.pdf
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 27
Preservation methods
Migration – transform formats as technologies change
Emulation – keep original data and application software and create programs to emulate
their behaviour on contemporary architectures
Formal descriptions – encode behaviours of original application, at creation, in a format
understood by a Universal Virtual Computer (a platform independent layer between
hardware and software) to allow reconstitution in original form.
Digital archaeology – future recovery as needed or exploratory basis
Computer museums – archive whole systems: hardware and software
29. SOURCES FOR STORE
• Checklist for ingest and store:
http://www.dcc.ac.uk/sites/default/files/documents/Ingest and Store Checklist.pdf
• An introduction to Repository Assessesment and DRAMBORA:
http://www.data-audit.eu/docs/DRAMBORA_launch_introduction.pdf
• DRAMBORA (Digital Repository Audit Method Based on Risk Assessment):
http://www.repositoryaudit.eu/
• DRAMBORA Interactive: User Guide:
https://www.era.lib.ed.ac.uk/bitstream/handle/1842/3328/Donnelly%20DRAMBORA
_Interactive_Manual.pdf?sequence=1&isAllowed=y
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 29
31. SOURCES FOR ACCESS, USE, AND REUSE
• Checklist for access and reuse:
http://www.dcc.ac.uk/sites/default/files/documents/Access and Reuse Checklist.pdf
• How to Cite Datasets and Link to Publications:
http://www.dcc.ac.uk/resources/how-guides/cite-datasets
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 31
37. Q1: ISAD(G) OR EAD (SAA)
ISAD(G) - General International Standard
for Archival Description
“A standard published by the International
Council on Archives that establishes general
rules for the description of archival
materials, regardless of format, to promote
consistent and sufficient descriptions, and to
facilitate exchange and integration of those
descriptions.”
Notes: ISAD(G) was first published in 1994
and revised in 1999.
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 37
EAD - Encoded Archival Description
“A standard used to mark up (encode) finding aids that
reflects the hierarchical nature of archival collections
and that provides a structure for describing the whole
of a collection, as well as its components.”
Notes: EAD is defined as a document type definition
(DTD) that is compatible with both Standard
Generalized Markup Language (SGML) and extensible
markup language (XML). See the related standards
Encoded Archival Description: Application Guidelines,
ver. 1.0 (Society of American Archivists, 1999); and
Encoded Archival Description: Tag Library, ver. 2002
(Society of American Archivists, 2003);
40. Q2: HOW TO APPLY DESCRIBING ARCHIVES: A CONTENT
STANDARD (DACS) ?
“…is an output-neutral set of rules for
describing archives, personal papers, and
manuscript collections, and can be applied to
all material types. It is the U.S. implementation
of international standards for the description
of archival materials and their creators.”
Relationship to Other Standards
• MAchine-Readable Cataloging (MARC21)
• Encoded Archival Description (EAD)
• Encoded Archival Context (EAC)
• Resource Description and Access (RDA)
• International Standard Archival
Description—General (ISAD[G])
• the International Standard Archival
Authority Record for Corporate Bodies,
Persons, and Families (ISAAR[CPF])
• the International Standard for Describing
Functions (ISDF)
Source:
http://files.archivists.org/pubs/DACS2E-
2013_v0315.pdf
6/24/2016
สิทธิศักดิ์รุ่งเจริญสุขศรี
40
Suggestion:
1. การจัดตั้ง
คณะทางานเพื่อ
ทาการศึกษา DACS
และจัดทาในรูปแบบ
คู่มือภาษาไทย โดยใช้
บริบทการทางาน
จดหมายเหตุไทยเป็น
ตัวอย่าง
45. BIBLIOGRAPHY
• DCC. DCC Curation Lifecycle Model. http://www.dcc.ac.uk/resources/curation-lifecycle-
model
• Elings, M. W and Günter Waibel, 2007. Metadata for All: Descriptive Standards and
Sharing across Libraies, Archives, and Museums.
http://firstmonday.org/article/view/1628/1543#author
• Hughes, L., 2004. Digitizing collections: Strategic issues for the information manager.
London: Facet Publishing.
• Harvey, R., 2010. Digital Curation: A How-To-Do-It-Manual. London: Neal-Schuman
Publishers, Inc.
• SAA, Glossary Search. http://www2.archivists.org/glossary#.V2PDezXigq4
6/24/2016สิทธิศักดิ์รุ่งเจริญสุขศรี 45
Editor's Notes
แนวคิดเรื่องการจัดการเอกสารเริ่มมีมมรตั้งแต่สมัยกรีกแล้ว แต่มาปรากฎให้เห็นรูปของกระบวนการจัดการที่เด่นชัดในสมัยคริสต์ศตวรรษที่ 19 เมื่อมีการสร้าง model สำหรับการจัดการเอกสารที่เรียกว่า Record lifecycle model ขึ้น โมเดลนี้มีจุดกำเนิดมาตั้งแต่สมัย WWI เมื่ออังกฤษต้องประสบปัญหากับการจัดเก็บเอกสารจากสงครามที่มากเกินความสามารถในการจัดการ และจัดเก็บ Sir Hilary Jenkinson เลยแนะนำว่า admin สามารถเลือกที่จะเลือกที่จะจัดเก็บและทำลายเอกสารได้ด้วยตนเอง จากนั้นเอกสารที่เหลือจากการคัดเลือกแล้วจะเป็นหน้าที่ของนักจดหมายเหตุ จากนั้น ในช่วง WWII T.R. Schellenberg ได้พัฒนา concept นี้ โดยมองว่า record นี้มีวงจรชีวิตในแต่ละช่วง แบ่งได้เป็น 4 ช่วง คือ
Creation – ถูกสร้างขึ้นเพื่อวัตถุประสงค์ของผู้สร้าง
Active/Current records (ในกระแสปฏิบัติการ) – ในช่วงนี้ record มี primary value ต่อผู้สร้างและผู้ปฏิบัติงานอื่นๆ ในองค์กร โดยในช่วงนี้ record ยังเก็บจัดอยู่ที่ผู้สร้าง หรือหน่วยงานที่สร้าง ในช่วงท้ายของ stage นี้ record อาจะได้รับการประเมินคุณค่าว่ายังมีคุณค่าหรือไม่ หรือควรส่งทำลาย หากยังมีคุณค่าก็จะส่งเข้า stage ต่อไป
กึ่งกระแส-ไม่ถูกใช้งานแล้ว – record ที่เข้าสู่ช่วงนี้จะได้รับการประเมินแล้วว่ามีคุณค่า แต่อาจจะไม่ได้ใช้งานตามปกติแล้ว และอาจไม่ได้จัดเก็บอยู่กับผู้สร้าง หรือหน่วยงานแล้ว โดยใน stage นี้ จะมีการประเมินคุณค่าอีกครั้ง ว่าจะทำลาย หรือส่งเข้าสู้ stage ต่อไป
Record ส่งเข้าสู่กระบวนการจดหมายเหตุ เพื่อการจัดการและการจัดเก็บ
อย่างไรก็ดีในช่วงปลายของคริสตศตววรรษที่ Record lifecycle model ก็ได้ถูกท้าทายด้วยการมาถึงของ digital records เนื่องด้วยลักษณะเฉพาะ 2 ประการ
บนพื้นฐานการทำงานจัดการเอกสารแบบดั้งเดิมถูกออกแบบบนพื้นฐานของการเป็นวัสดุที่จับต้องได้ หรือแม้ว่าจะมีการผนวกเอา digital record เป็นส่วนหนึ่งของ archive ก็ยังมองว่าสื่อเรานี้เป็นประเภทเดียวกับสื่อโสตทัศน์ เช่น film or microfitch แต่ทั้งนี้เราไม่สามารถแยกได้แบบนั้น เพราะทั้งเอกสารที่เป็นตัววัสดุ หรือตัวที่เป็นไฟล์ ต่างถูกสร้างขึ้นเพื่อวัตถุประสงค์การใช้งานเดียวกัน แต่ต่างกันแค่ structure และ Form digital rec. ถูกสร้างขึ้นในรูปแบบไฟล์ และต้องการ device ในการเข้าถึง
โมเดลเดิมที่มองว่า rec. มีวงจรชีวิตตั้งแต่เริ่มสร้างจนสิ้นสุดการใช้งาน ไม่ครอบคลุมกับ specific character of digital rec. 1) เส้นทางชีวิตของ rec. สามารถย้อมกลับได้ เพื่อนำไปใช้งานในวัตถุประสงค์อื่นๆ 2) การออกแบบระบบเพื่อการจัดเก็บต่างหาก ที่เป็นสิ่งที่ควรทำลำดับแรก ไม่ใช้การสร้าง 3) การแบ่งคุณค่าของ rec. เป็น primary/secondary value ตามแต่ละ stage อาจไม่จำเป็น เพราะภายหลังการสร้างแล้ว rec.บางชิ้น อาจมีคุณค่าครบถ้วนแล้ว ทั้งในเชิงต่อผู้สร้าง และประวัติศาสตร์ หรือวัฒนธรรมที่ผู้ใช้อื่นๆ สามารถนำไปตีความต่อไป
จาก DC Model นี่เราจะเห็นว่า Data หรือ ข้อมูลเป็นสิ่งที่เกิดขึ้นอยู่ตรงกลาง โดยนิยามคำว่า Data ของ DC นี่ครอบคลุมสารสนเทศทั้งหลายที่อยู่ในรูป binary form หรือก็คือเลขฐานสอง (0 และ 1) โดยครอบคลุมทั้ง
‘Simple digital objects’ such as textual files, images or sound files, along with their related identifiers and metadata.
‘Complex digital objects’ are discrete digital objects , made by combining a number of other digital objects, such as Websites.”
Database …structured collections of records or data stored in a computer system”
โดย DC model แบ่งการทำงานออกได้เป็น 3 รูปแบบ 8nv
Action 1: Full Lifecycle Actions
Action 2: Sequential Actions
Action 3: Occasional Actions
จากทั้ง 3 actions เพื่อให้เห็นกระบวนการทำงานที่เป็นรูปธรรมที่สุด ผมขออธิบาย Action 2 ซึ่งจะอธิบาย workflow ในการจัดการข้อมูลดิจิทัลได้เด่นชัดที่สุด
Description Inf. (Metadata)
Persistently identifies data and maintains reliable links to them
Clearly describes what they are
Clearly identifies technical inf. needed to use data
Identifies who is responsible for their management and preservation
Describe what can be done to them
Describes what is needed to present them at the required level of fidelity (n. ความถูกต้อง)
Records their history and documents their authenticity
Allows users to understand their context and relation to other objects
Representation inf.
Structure Information: describes the format and data structure concepts to be applied to the bitstream, which result in more meaningful values like characters or number of pixels.
Semantic Information: this is needed on top of the structure information. If the digital object is interpreted by the structure information as a sequence of text characters, the semantic information should include details of which language is being expressed.
Other Representation Information: includes information about relevant software, hardware and storage media, encryption or compression algorithms, and printed documentation.
Preservation Planning – ensure future data access
a set of managed activities
aims at ensuring the bit-stream is maintained
aims at ensuring that data are accessible
is concerned with maintaining bit streams and ensuring accessibility for a definable period of time
Community Watch and Participation – benefits of collaboration
access to a wider range of expertise
access to tools and systems that might otherwise be unavailable
encouragement for other stakeholders to take preservation seriously
shared influence on R&D of standards and practices
attraction of resources and other support for well-coordinated programmes at a regional, national or sectoral level
shared influence on agreements with producers
increased coverage of preserved materials
better planning to reduce wasted effort
shared development costs
shared learning opportunities
Curate and Preservation
Be aware of, and undertake management and administrative actions planned to promote curation and preservation throughout the curation lifecycle
Dispose
Dispose of data, which has not been selected for long-term curation and preservation in accordance with documented policies, guidance or legal requirements.
Typically data may be transferred to another archive, repository, data centre or other custodian. In some instances data is destroyed. The data’s nature may, for legal reasons, necessitate secure destruction.
Transfer
if no longer relevant for business function but useful to someone else
for safe keeping – institutional archive
for greater accessibility – more widely accessible data archive
secure destruction – prevent re-use or reconstruction
sensitive data no longer relevant for business function
Reappraisal
Return data which fails validation procedures for further appraisal and reselection
เพื่อการตัดสินใจก่อนการจัดเก็บข้อมูลระยะยาว โดยมีคำถามสำคัญ 2 ข้อ คือ
How long do we want to keep the data?
How long do we need to keep the data?
1. การกำหนดขอบเขตของข้อมูลที่จะจัดเก็บ
- การคัดเลือกข้อมูลที่จะเก็บไว้ใช้ในอนาคต
- การกำหนดระยะเวลาในการเก็บรักษาข้อมูล
2. พัฒนาและประยุกต์ใช้นโยบายการประเมินและคัดเลือก
การกำหนดและให้นิยามกลุ่มเป้าหมายที่จะใช้ข้อมูล
ความเป็นไปได้ในการสงวนรักษาข้อมูลในอนาคต ทั้งในแง่ของการใช้จ่ายงบประมาณเพื่อการบำรุงรักษา และความพร้อมของเครื่องมือที่มี
ข้อควรระวังทางด้านกฎหมายเกี่ยวกับการจัดการและเผยแพร่ข้อมูล รวมถึงสิทธิ์ในทรัพย์สินทางปัญญาที่ต้องมีการจัดการอย่างเหมาะสม
ความสำคัญของข้อมูลที่มีต่อองค์กร รวมถึงการประเมินความเสียหายที่อาจจะเกิดขึ้นได้ หากข้อมูลไม่ได้รับการคัดเลือกเพื่อจัดเก็บ
การสงวนรักษาและเชื่อมโยงเมทาดาทาที่จำเป็นต่อการใช้งานข้อมูลดิจิทัลอีกครั้งในอนาคต
การสร้างหลักเกณฑ์ในการประเมินและคัดเลือกข้อมูล
3. พัฒนาและประยุกต์ใช้หลักเกณฑ์การประเมินซ้ำและการจำหน่ายออก
Description information และ Representation information ของข้อมูลให้เหมาะสม
What is DRAMBORA?
DRAMBORA (Digital Repository Audit Method Based On Risk Assessment) originated as a paper-based methodology for helping repository managers to develop a documented understanding of the risks they face, expressed in terms of probability and potential impact. These risks are then mapped to organisational aspirations and effort allocations in order to facilitate ongoing organisational development and resource allocation. In short, DRAMBORA offers a quantifiable insight into the severity of risks faced by repositories right now, and an effective means for reporting these.
The purpose of the DRAMBORA toolkit is to facilitate the auditor in:
- Defining the mandate and scope of functions of the repository
Identifying the activities and assets of the repository
Identifying the risks and vulnerabilities associated with the mandate, activities and assets
Assessing and calculating the risks
Defining risk management measures
Reporting on the self-audit
เพื่อให้แน่ใจว่าข้อมูลผู้ใช้งานสามารถเข้าถึงข้อมูลได้ และสามารถใช้งานได้อีกในอนาคต
Standard metadata
ระบุรายละเอียด/ขอบเขตการอนุญาตให้ใช้ข้อมูลที่แน่ชัดการ user
จัดเตรียมเครื่องมือเพื่อรองรับการแลกเปลี่ยนข้อมูลกับหน่วยงานอื่นๆ
ในประเด็นสุดท้ายนี้ เดี๋ยวจะอธิบายให้เห็นตัวอย่างอย่างละเอียดอีกทีในแนวทางการประยุกต์ใช้ Thesaurus กับการจัดการสารสนเทศดิจิทัล
What is DRAMBORA?
DRAMBORA (Digital Repository Audit Method Based On Risk Assessment) originated as a paper-based methodology for helping repository managers to develop a documented understanding of the risks they face, expressed in terms of probability and potential impact. These risks are then mapped to organisational aspirations and effort allocations in order to facilitate ongoing organisational development and resource allocation. In short, DRAMBORA offers a quantifiable insight into the severity of risks faced by repositories right now, and an effective means for reporting these.
The purpose of the DRAMBORA toolkit is to facilitate the auditor in:
- Defining the mandate and scope of functions of the repository
- Identifying the activities and assets of the repository
Identifying the risks and vulnerabilities associated with the mandate, activities and assets
Assessing and calculating the risks
Defining risk management measures
Reporting on the self-audit