DSpace Toplu Metadata Düzenleme Aracı

Üst Veri Düzenleme

Toplu Meta Veri Düzenleme Aracı

DSpace, toplu meta veri düzenleme aracı sağlar. Toplu düzenleme aracı, CSV biçiminde virgülle ayrılmış bir dosya üretebilir. Toplu düzenleme aracı, kullanıcının aşağıdakileri gerçekleştirmesini sağlar:

  • Meta verilerin toplu olarak düzenlenmesi (örneğin harici bir yazım denetimi gerçekleştirme)
  • Toplu meta veri eklemeleri (örneğin, bir dizi öğeye bir özet ekleyin, LCSH gibi kontrollü kelimeler ekleyin)
  • Toplu iş meta veri değerlerini bulur ve değiştirir (örneğin, çeşitli kayıtlarda yanlış yazılmış soyadı)
  • Koleksiyonlar arasında öğeleri toplu taşıma
  • Öğelerin toplu olarak silinmesi, geri çekilmesi veya yeniden beyan edilmesi
  • CSV dosyası aracılığıyla yeni öğelerin toplu olarak eklenmesini (bit akışları olmadan) etkinleştirin
  • Bir listedeki değerleri tekrar sıralayın (örneğin yazarlar)

Toplu Meta Veri Düzenleme aracının yapılandırma seçenekleri hakkında bilgi için, bkz: Toplu Meta Veri Düzenleme Yapılandırması

İhracat fonksiyonu

Web Arabirimi Verme

Toplu meta veri dışa aktarmaları (CSV'ye) Yönetim menüsünden yapılabilir:

  • Yönetici kullanıcı olarak giriş yapın
  • CSV’ye aktarmak istediğiniz Topluluğa veya Koleksiyona göz atın
    • NOT: JSPUI'de, arama sonuçlarını CSV'ye aktarmak da mümkündür. Sadece bir arama yapın ve arama sonuçlarının üstündeki "Meta Verileri Dışa Aktar" düğmesini tıklayın.
  • İndirilebilir bir CSV’ye dışa aktarmak için "Meta Verileri Dışa Aktar" bağlantısını tıklayın
    • XMLUI'de, Topluluk / Koleksiyon ana sayfasındaki "İçerik" menüsünde "Meta Verileri Dışa Aktar" öğelerini bulabilirsiniz.
    • JSPUI'de, Topluluk / Koleksiyon ana sayfasındaki "Yönetici Araçları" menüsünde "Meta Verileri Dışa Aktar" öğelerini bulabilirsiniz.

Lütfen CSV formatı ve CSV'yi düzenleyerek gerçekleştirilebilecek eylemler hakkında daha fazla bilgi için aşağıdaki belgelere bakın .

Komut Satırı Verme

Aşağıdaki tablo temelleri özetlemektedir.

Kullanılan komut:

[dspace]/bin/dspace metadata-export

Java sınıfı:

org.dspace.app.bulkedit.MetadataExport

Argümanlar kısa ve (uzun) formlar):

Açıklama

-f veya --file

Gereklidir. Elde edilen CSV'nin dosya adı.

-i veya --id

Verilecek Öğe, Koleksiyon veya Topluluk tanıtıcısı veya Veritabanı Kimliği. Belirtilmezse, tüm öğeler dışa aktarılır.

-a veya --all

Normal olarak değiştirilmeyen tüm meta veri alanlarını (örneğin, provenans) veya [dspace]/config/modules/bulkedit.cfgdışa aktarmada göz ardı edilecek şekilde yapılandırdığınız alanları ekleyin .

-h veya --help

Yardım sayfasını görüntüleyin.

Toplu düzenleme ihracatcısını komut satırında çalıştırmak için:

[dspace]/bin/dspace metadata-export -f name_of_file.csv -i 1023/24

Örnek:

[dspace]/bin/dspace metadata-export -f /batch_export/col_14.csv -i /1989.1/24

Yukarıdaki örnekte, ' 1989.1 / 24 ' tanıtıcısı ile atanan bir koleksiyonun, tüm koleksiyonu / batch_export ' dizininde bulunan col_14.csv ' dosyasına vermesini istedik .

Lütfen CSV formatı ve CSV'yi düzenleyerek gerçekleştirilebilecek eylemler hakkında  daha fazla bilgi için aşağıdaki belgelere bakın.


İçe Aktarma İşlevi

Büyük CSV dosyalarını içe aktarma

1.000'den fazla satırdan oluşan CSV dosyalarının içe aktarılması önerilmez (yani 1.000 öğe). Bundan daha büyük dosyaları içe aktarırken, bir Yöneticinin içe aktarma aracının yapacağı değişiklikleri doğru bir şekilde doğrulaması zor olabilir. Ayrıca, DSpace sitesinde mevcut olan belleğe bağlı olarak, büyük dosyalar içe aktarma işlemi sırasında 'Bellek Dışı' hatalarına yol açabilir.

Web Arabirimi İçe Aktarma

Toplu meta veri içe aktarma işlemleri (CSV’den) Yönetim menüsünden yapılabilir:

  • Öncelikle, CSV’nin tüm düzenlemelerini tamamlayın ve değişikliklerinizi kaydedin
  • Yönetici Kullanıcı Olarak Giriş Yapın
  • "Meta Verileri İçe Aktar" ı tıklayın ve CSV dosyasını seçin
    • XMLUI'de, "Meta Verileri İçe Aktar" herhangi bir sayfadaki "Yönetim" menüsünün altında bulunabilir.
    • JSPUI'de "Yönetici Verileri" menüsünde (Kullanıcı hesabınızın açılır menüsünün altında) "Meta Verileri İçe Aktar" bölümünde bulabilirsiniz. Yönetim Araçları sayfasında, "İçerik" açılır menüsünden "Meta Verileri İçe Aktar" ı seçin.
  • CSV’yi yükledikten sonra, sistemde yapılacak tüm değişikliklerin bir özeti sunulur. Bu değişiklikleri gözden geçirip uygulayıp iptal etmeyeceğinizi seçebilirsiniz.

Komut Satırı İçe Aktarma

Aşağıdaki tablo temelleri özetlemektedir.

Kullanılan komut:

[dspace]/bin/dspace metadata-import

Java sınıfı:

org.dspace.app.bulkedit.MetadataImport

Argümanlar kısa ve (uzun) formlar:

Açıklama

-f veya --file

Gereklidir. Yüklenecek CSV dosyasının dosya adı.

-s veya --silent

Sessiz mod. İçe aktarma işlevi sizden değişiklikleri yapmak istediğinizden emin olmanızı istemez.

-e veya --email

Kullanıcının e-posta adresi. Bu yalnızca yeni öğeler eklerken gereklidir.

-w veya --workflow

Yeni öğeler eklerken, program Koleksiyon İş Akışı işlemlerini kullanmak için öğeleri sıraya koyacaktır.

-n veya --notify

Bir iş akışı kullanarak yeni öğeler eklerken, bildirim e-postaları gönderin.

-t veya --template

Yeni öğeler eklerken, varsa Koleksiyon şablonunu kullanın.

-h veya --help

Kısa yardım sayfasını görüntüleyin.

Sessiz Mod dikkatli kullanılmalıdır. Yanlış verileri üst üste bindirmeniz ve veritabanında onarılamaz bir hasara yol açmanız mümkündür.

Parti içe aktarıcıyı komut satırında çalıştırmak için:

[dspace]/bin/dspace metadata-import -f name_of_file.csv

Örnek

[dspace]/bin/dspace metadata-import -f /dImport/col_14.csv

Yeni meta verileri bit akışları olmadan yüklemek isterseniz, komut satırında:

[dspace]/bin/dspace metadata-import -f /dImport/new_file.csv -e joe@user.com -w -n -t

Yukarıdaki örnekte tüm argümanları attık. Bu, meta verileri ekler ve eklenen öğelere uygulanacak iş akışını, bildirimi ve şablonları birleştirir.

CSV Biçimi

CSV (virgülle ayrılmış değerler), bu aracın RFC4180 CSV biçimine göre içe ve dışa aktarabildiği dosyaları Bu, yeni satırların ve gömülü virgüllerin, elemanları çift tırnak içine alarak ekleyebileceği anlamına gelir. İki çift tırnak kullanarak çift tırnak dahil edilebilir. Kod bütün bunları sizin için yapar ve Excel veya OpenOffice gibi herhangi bir iyi csv editörü bu sözleşmeye uyacaktır.

Tüm CSV dosyaları, tüm dilleri desteklemek için UTF-8 kodlamasında da bulunur.

Dosya yapısı

CSV'nin ilk satırı, CSV'nin geri kalanının temsil ettiği meta veri değerlerini tanımlamalıdır. İlk sütun her zaman öğenin dahili veritabanı kimliğine atıfta bulunan "id" olmalıdır . Diğer tüm sütunlar isteğe bağlıdır. Diğer sütunlar, verinin bulunduğu dublin çekirdek meta veri alanlarını içerir.

Tipik bir başlık satırı şöyle görünür:

id,collection,dc.title,dc.contributor,dc.date.issued,etc,etc,etc.

CSV dosyasındaki sonraki satırlar öğelerle ilgilidir. Tipik bir satır şöyle görünebilir:

350,2292,Item title,"Smith, John",2008

Belirli bir meta veri öğesi için birden fazla değer saklamak istiyorsanız, bunlar '-' çift borulu ile ayrılabilir. (veya modules/bulkedit.cfgdosyanızda tanımladığınız başka bir karakter ). Örneğin:

Horses||Dogs||Cats

Öğeler, veritabanında CSV dosyasında göründükleri sırayla depolanır. Bunu yazarlar gibi emrin önemli olabileceği unsurları veya Kongre Kütüphanesi Konu Başlıkları gibi kontrollü kelime haznelerini sipariş etmek için kullanabilirsiniz.



CSV'yi düzenleme

Microsoft Excel ile düzenleme yapıyorsanız, CSV'yi Unicode / UTF-8 kodlamasında açtığınızdan emin olun.

Varsayılan olarak, Microsoft Excel CSV'yi Unicode / UTF-8 kodlamasında doğru açmayabilir. Bu, özel karakterlerin yanlış gösterilebileceği ve CSV'nin yeniden içe aktarılması sırasında "bozulabileceği" anlamına gelir.

Excel'e bu CSV'nin Unicode olduğunu söylemelisiniz, aşağıdaki şekilde alarak. Lütfen bu talimatların MS Office 2007 ve 2013 için geçerli olduğunu unutmayın. Diğer Office sürümleri değişebilir )

  • İlk olarak, Excel'i açın (boş bir sayfa / çalışma kitabı açık)
  • "Veri" sekmesini seçin
  • "Metinden" düğmesine tıklayın ("Dış Veri" bölümünde)
  • CSV dosyanızı seçin
  • Sihirbaz Adım 1
    • "Sınırlandırılmış" seçeneğini seçin
    • Satırı içe aktarmaya başla: 1
    • "Dosya orijini" seçim kutusunda, "65001: Unicode (UTF-8)" seçin.
      • NOT: bu kodlama seçenekleri alfabetik olarak sıralanır, bu nedenle listenin altında "Unicode (UTF-8)" görünür.
    • Sonrakine tıkla
  • Sihirbaz Adım 2
    • Tek sınırlayıcı olarak "Virgül" ü seçin
    • Sonrakine tıkla
  • Sihirbaz Adım 3
    • "Sütun veri formatı" olarak "Metin" i seçin ( Ne yazık ki, bu her Excel için ayrı ayrı Excel'de yapılmalıdır )
      • En azından, tüm tarih sütunlarının (örn. Dc.date.issued) "Metin" olarak değerlendirildiğinden emin olmalısınız, böylece Excel, DSpace'in YYYY-AA-GG biçimini MM / DD / YYYY'ye otomatik olarak dönüştürmez
      • Böyle bir otomatik dönüşümü önlemek için, her bir sütunun "Metin" olarak değerlendirilmesini sağlamak en güvenli yoldur. Ne yazık ki, bu, her bir sütunu birer birer seçmek ve "Sütun veri formatı" olarak "Metin" seçmek anlamına gelir.
    • Son'u tıklayın
  • CSV'nin mevcut sayfada mı yoksa yeni bir sayfada mı açılacağını seçin.

Düzenleme İşlemini Basitleştirmeye Yönelik İpuçları

 Bir CSV'yi düzenlerken, aklınızda bulundurmanız gereken birkaç temel ipucu:

  1. "İd" sütunu bozulmadan kalmalıdır. Bu sütun aynı zamanda her zaman içinde bir değere sahip olmalıdır.
  2. CSV'yi basitleştirmek için, düzenlemek istemediğiniz sütunları kolayca kaldırabilirsiniz ("id" sütunu hariç, bakınız # 1). Endişelenmeyin, sütunun tamamını kaldırmak meta verileri silmez (bkz. # 3)
  3. CSV dosyası içe aktarırken, ithalatçı olacak  bindirmek  farklılıkları belirlemek üzere havuzda zaten ne üzerine meta. Bu sadece ziyade komple madde meta verilerine göre, CSV dosyasının içeriği üzerinde hareket eder. Bu, dışa aktarılan CSV dosyasının yeniden içe aktarılmadan önce büyük ölçüde manipüle edilebileceği anlamına gelir. Satırlar (öğeler) veya Sütunlar (meta veri öğeleri) kaldırılabilir ve dikkate alınmaz. 
    1. Örneğin, yalnızca "dc.subject" dosyasını düzenlemek istiyorsanız, "dc.subject" alanını değiştirebilmeniz için "id" ve "dc.subject" için ALL EXCEPT sütunlarını kaldırabilirsiniz. İçe aktarma sırasında DSpace, CSV'nize yalnızca "dc.subject" alanını eklediğinizi görecek ve bu nedenle, bu CSV'de listelenen öğeler için yalnızca "dc.subject" meta veri alanını güncelleyecektir.
  4. Bir sütunun tamamının kaldırılması meta veri değerlerini DEĞİLDİR, çünkü bir meta veri değerini gerçekten silmek istiyorsanız, sütunu bozulmadan bırakmalı ve uygun satırın değerini silmelisiniz (o sütunda).

 

Koleksiyon Üyeliğini Düzenleme

'Kolleksiyon' sütunundaki toplama tutamaçlarını düzenleyerek öğeler koleksiyonlar arasında taşınabilir. Birden fazla koleksiyon dahil edilebilir. İlk koleksiyon 'sahiplik koleksiyonudur'. Sahip olan koleksiyon, öğenin içinde göründüğü birincil koleksiyondur. Sonraki koleksiyonlar (alan ayırıcıyla ayrılmış), eşlenmiş koleksiyonlar olarak değerlendirilir. Bunlar, DSpace kullanıcı arayüzünde harita öğesi işlevini kullanmakla aynıdır. Öğeleri koleksiyonlar arasında taşımak veya eşlenecekleri diğer koleksiyonları düzenlemek için koleksiyon sütunundaki verileri değiştirin.

Yalnızca Meta Veri Öğeleri Ekleme

Toplu meta veri içe aktarıcı kullanılarak DSpace'e yalnızca yeni meta veri öğeleri eklenebilir. Bunu yapmak için, ilk 'id' sütununa '+' artı işaretini girin. İthalatçı daha sonra bunu yeni bir ürün olarak ele alacaktır. Komut satırı içe aktarıcısını kullanıyorsanız, kullanıcının e-posta adresini veya öğeleri gönderirken kayıtlı olan kullanıcının kimliğini belirtmek için -e bayrağını kullanmanız gerekir.

Meta Verileri Silme

Dışa aktarılan bir dosyadan belirli meta veri alanlarının tümünde meta veri silme işlemi gerçekleştirmek mümkündür. Örneğin, örneğin toplu olarak kaldırılması gereken anahtar kelimeler (dc.subject) kullandığınızı varsayalım Sütunu (dc.subject) bozulmadan bırakırsınız, ancak ilgili satırlardaki verileri kaldırırsınız.

Öğelerde 'işlem' gerçekleştirme

Maddeler üzerinde belirli 'eylemler' yapmak mümkündür. Bu, CSV dosyasına bir "işlem" sütunu eklenerek (id'den sonra ve toplama sütunlarından sonra) elde edilir. Üç olası eylem var:

  1. 'expunge' Bu, bir öğeyi kalıcı olarak siler. Dikkatli kullanın! Bu işlem, 'allowexpunge = true' ayarlayarak etkinleştirilmelidir. modules/bulkedit.cfg
  2. 'withdraw' Bu, bir öğeyi arşivden çeker, ancak silmez.
  3. 'reinstate' Bu, daha önce geri çekilmiş bir öğeyi eski durumuna getirir.

Bir eylem değişiklik yapmazsa (örneğin, zaten çekilmiş bir öğenin çekilmesini istemek gibi), o zaman, değişmemiş meta veriler gibi, bu göz ardı edilir.

Veri Taşıma veya Veri Alışverişi

Bir Dublin Çekirdek (DC) öğesinde verileriniz olması ve gerçekten başka bir yerde olmasını istemeniz mümkündür. Örnek olarak, personeliniz, LCSH alanı (dc.subject.lcsh) yerine Konu alanına Kongre Kütüphanesi Konu Başlıkları'na giriş yapmış olabilir. Şu adımları izleyin; verileriniz içe aktarma işleminde taşınır:

  1. Yeni bir sütun ekleyin. İlk satır yeni meta veri öğesi olmalıdır. (HEDEF olarak adlandıracağız)
  2. Değiştirmek istediğiniz verinin sütununu / satırını seçin. (SOURCE olarak bahsedeceğiz)
  3. Bu verileri kesip 1. Adımda oluşturduğunuz yeni sütuna (TARGET) yapıştırın.
  4. Kesdiğiniz ve yapıştırdığınız sütunu (SOURCE) boş bırakın. Silmeyin.

Ortak sorunlar

CSV dışa aktarmasındaki meta veri değerleri yinelenen sütunlara sahip görünüyor
DSpace, CSV yüklendiğinde "Hiçbir değişiklik algılanmadı" yanıtını veriyor.

Maalesef, bu cevap birçok yönden kaynaklanıyor olabilir.

  • Düzenlemeden sonra CSV'nin düzgün şekilde kaydedilmemiş olması mümkündür. Düzenlemelerin CSV’de olduğunu ve DSpace günlüklerinde arka uç hatası olmadığını kontrol edin (bu, geçersiz veya bozuk bir CSV dosyasının bir göstergesi olur)
  • DSpace sürümüne bağlı olarak, CSV dosyalarındaki satır çizgilerini işlerken bu bilinen hatayla karşılaşabilirsiniz:  DS-3245
  • CSV'de yeni bir ambargo tarihi ayarlıyorsanız, ambargo kaldırma tarihinin gelecekteki bir tarih olduğundan emin olun. Geçmiş tarihlerin DSpace'in öğe değişikliklerini yoksaymasına neden olabileceği bildirildi.