/ - Diff - Plateforme TXM - Forge du Centre Blaise Pascal

Révision 2967

     		if (s.length() == 0) {
     			return s;
+    		}
     		// ensure the "w_" prefix presence
     		if (s.startsWith("w")) {
     			if (!s.startsWith("w_")) {
-...
     		} else {
     			s = "w_" + s;
+    		}
     		//System.out.println("first="+s);
     		// System.out.println("first="+s);
     		String rez = convertNonAscii(s);//.toLowerCase();
     		//System.out.println("nonasscii="+rez);
     		String rez = convertNonAscii(s);// .toLowerCase();
     		// System.out.println("nonasscii="+rez);
     		rez = rez.replaceAll("\\p{Space}++", "_");
     		//System.out.println("spaces="+rez);
     		// System.out.println("spaces="+rez);
     		rez = rez.replaceAll("[¤€§µ£°().,;:/?!@§%\\\\\"’ʹ'*+\\-}\\]\\[{#~&]", ""); //$NON-NLS-1$ //$NON-NLS-2$ // "[^\\P{P}_]"
     		//System.out.println("ponc="+rez);
     		// System.out.println("ponc="+rez);
     		return rez;
+    	}
-...
     			return s;
+    		}
     		String rez = s.trim();
     		s = s.replaceAll("\\p{Space}++", "_");
     		rez = rez.replaceAll("\\p{Space}++", "_");
     		rez = rez.replaceAll("_", "-");
     		rez = convertNonAscii(rez).toLowerCase();
     		rez = rez.replaceAll("[¤€§µ£°().,;:/?!@§%\\\\\"’ʹ'*+\\}\\]\\[{#~&]", ""); //$NON-NLS-1$ //$NON-NLS-2$
     		// remove first chars if number
     		char c = rez.charAt(0);
-...
     	public static void main(String args[]) {
     		String s = "01The result : - - _ тврьдо È,É,Ê,Ë,Û,Ù,Ï,Î,À,Â,Ô,è,é,ê,ë,û,ù,ï,î,à,â,ô,ç  0 1 2 3 4 5 6 7 8 9 10"; //$NON-NLS-1$
     		System.out.println(AsciiUtils.convertNonAscii(s));
     		//System.out.println(AsciiUtils.buildId(s));
     		// System.out.println(AsciiUtils.buildId(s));
     		String s2 = "w_ТВРЬДОтврьдо_123&é\"'(-è_çà)=/*-+~#{[|`\\^@]}¤;:!§/.?µ%£°";
     		System.out.println("nonascii="+AsciiUtils.convertNonAscii(s2));
     		System.out.println("word_id="+AsciiUtils.buildWordId(s2));
     		System.out.println("attribute_id="+AsciiUtils.buildAttributeId(s2));
     		System.out.println("nonascii=" + AsciiUtils.convertNonAscii(s2));
     		System.out.println("word_id=" + AsciiUtils.buildWordId(s2));
     		System.out.println("attribute_id=" + AsciiUtils.buildAttributeId(s2));
     		// output :
     		// The result : E,E,E,E,U,U,I,I,A,A,O,e,e,e,e,u,u,i,i,a,a,o,c

Formats disponibles : Unified diff

Laboratoire ICAR » Plateforme TXM

Révision 2967