SP-13.INS 21.02.99 / 11.08.00 Installation SGML-Parser SP 1.3 von James Clark (fuer neuen SGML-Parser in Harvest 1.5.20/1.6.1) ================================================ Programm-Quelle: http://www.jclark.com/sp/ ftp://ftp.jclark.com/pub/sp/sp-1.3.tar.gz 1. Allgemeines: --------------- - Benoetigt wird ein C++ Compiler: z.B. GNU C++ 2.7.2 mit libg++ 2.7 ff. - Uebertragen des Quelltextes von ftp.jclark.com - Dokumentation als HTML-Dokumente: nach dem Auspacken unter "doc/index.htm" 2. Uebersetzen und Installieren: -------------------------------- - gunzip sp-1.3.tar.gz - tar xvf sp-1.3.tar - cd sp-1.3 - Lesen Dokumentation in HTML: doc/index.htm , doc/build.htm - vi Makefile prefix = /usr/local XDEFINES = -DSGML_CATALOG_FILES_DEFAULT= \ \"/usr/local/harvest/lib/gatherer/sgmls-lib/catalog\" LIBOBJS = # strerror.o memmove.o XLIBS = -lsocket -lnsl - make 2>&1 | tee gen.log (Linux 75 MHz: ca. 40 min) Es entstehen die Binaries: + nsgmls/nsgmls Ersatz fuer "sgmls" + spam/spam sophisticated normalizer, markup stream editor + sgmlnorm/sgmlnorm simpler normalizer + spent/spent program providing access to SP's entity manager + sx/sx converter from SGML to XML - make install Es werden + nsgmls, spam, sgmlnorm, spent und sx nach "/usr/local/bin/" uebertragen. - for i in nsgmls spam sgmlnorm spent sx do strip /usr/local/bin/$i; done 3. Einbau des SGML-Parser "nsgml" in Harvest 1.5.20/1.6.1 --------------------------------------------------------- Lt. Zeitschrift "iX" Heft 3/1999 S. 126 wird der Harvest-eigene SGML-Parser vereinfacht ersetzt: cd $HARVEST_HOME/lib/gatherer mv sgmls sgmls.orig cp .../nsgmls nsgmls ln -s nsgmls sgmls