nani/app

Julien LepillerThu Apr 18 20:20:36+0200 2019

c87b6c4

Update data format

app/src/main/java/eu/lepiller/nani/dictionary/DictionaryFactory.java

     private DictionaryFactory(Context context) {
         dictionaries = new ArrayList<>();
         dictionaries.add(new JMDict("example_jmdict",
                 context.getString(R.string.dico_jmdict_example),
                 context.getCacheDir(),
                 "https://xana.lepiller.eu/nani/dico/example.nani"));
         dictionaries.add(new JMDict("JMdict_e",
                 context.getString(R.string.dico_jmdict_e),
                 context.getCacheDir(),
                 "https://xana.lepiller.eu/nani/dico/JMdict_e.nani"));
                 "https://nani.lepiller.eu/dicos/JMdict_e.nani"));
         dictionaries.add(new JMDict("JMdict_dut",
                 context.getString(R.string.dico_jmdict_dut),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_dut.nani"));
         dictionaries.add(new JMDict("JMdict_fre",
                 context.getString(R.string.dico_jmdict_fre),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_fre.nani"));
         dictionaries.add(new JMDict("JMdict_ger",
                 context.getString(R.string.dico_jmdict_ger),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_ger.nani"));
         dictionaries.add(new JMDict("JMdict_hun",
                 context.getString(R.string.dico_jmdict_hun),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_hun.nani"));
         dictionaries.add(new JMDict("JMdict_rus",
                 context.getString(R.string.dico_jmdict_rus),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_rus.nani"));
         dictionaries.add(new JMDict("JMdict_slv",
                 context.getString(R.string.dico_jmdict_slv),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_slv.nani"));
         dictionaries.add(new JMDict("JMdict_spa",
                 context.getString(R.string.dico_jmdict_spa),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_spa.nani"));
         dictionaries.add(new JMDict("JMdict_swe",
                 context.getString(R.string.dico_jmdict_swe),
                 context.getCacheDir(),
                 "https://nani.lepiller.eu/dicos/JMdict_swe.nani"));
     }
     public static ArrayList<Result> search(Context context, String text) {

app/src/main/java/eu/lepiller/nani/dictionary/JMDict.java

 import java.io.File;
 import java.io.FileNotFoundException;
 import java.io.FileReader;
 import java.io.IOException;
 import java.io.RandomAccessFile;
 import java.net.MalformedURLException;
 import java.net.URL;
 import java.nio.charset.StandardCharsets;
 import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.Comparator;
 import java.util.HashMap;
 import java.util.List;
 import java.util.Map;
 import eu.lepiller.nani.R;
 import eu.lepiller.nani.result.Result;
 public class JMDict extends Dictionary {
     final static String TAG = "JMDICT";
     interface Huffman {
     }
     static class HuffmanTree implements Huffman {
         Huffman left, right;
         HuffmanTree(Huffman left, Huffman right) {
             this.left = left;
             this.right = right;
         }
     }
     static class HuffmanValue implements Huffman {
         String character;
         HuffmanValue(String character) {
             this.character = character;
         }
     }
     final private static String TAG = "JMDICT";
     private String mUrl;
     private Huffman kanjiHuffman, readingHuffman, meaningHuffman;
     JMDict(String name, String description, File cacheDir, String url) {
         super(name, description, cacheDir);
     public void remove() {
         File file = getFile();
         file.delete();
         kanjiHuffman = null;
         readingHuffman = null;
         meaningHuffman = null;
     }
     private ArrayList<String> getStringList(RandomAccessFile file) throws IOException {
         ArrayList<String> results = new ArrayList<>();
         int number = file.readInt();
         int number = file.readShort();
         for(int i=0; i<number; i++) {
             results.add(file.readUTF());
         }
         return results;
     }
     private String getHuffmanString(RandomAccessFile file, Huffman huffman) throws IOException {
         StringBuilder b = new StringBuilder();
         ArrayList<Boolean> bits = new ArrayList<>();
         String c = null;
         Huffman h = huffman;
         while(c == null || !c.isEmpty()) {
             if(h instanceof HuffmanValue) {
                 c = ((HuffmanValue) h).character;
                 Log.d(TAG, "Huffman read: " + c);
                 b.append(c);
                 h = huffman;
             } else if(h instanceof HuffmanTree) {
                 if(bits.isEmpty()) {
                     byte by = file.readByte();
                     Log.d(TAG, "Read byte for huffman: " + by);
                     short mod = (short)256;
                     while(mod != 1) {
                         mod /= 2;
                         bits.add((by / mod) > 0);
                         by = (byte)(by % mod);
                     }
                     Log.d(TAG, "Read byte for huffman: " + bits);
                 }
                 Boolean bo = bits.get(0);
                 bits.remove(0);
                 h = bo? ((HuffmanTree) h).right: ((HuffmanTree) h).left;
             }
         }
         return b.toString();
     }
     private void logHuffman(Huffman h, ArrayList<Boolean> addr) {
         if (h instanceof HuffmanValue) {
             Log.d(TAG, "HUFF: " + ((HuffmanValue) h).character + " -> " + addr.toString());
         } else if(h instanceof HuffmanTree) {
             ArrayList<Boolean> addr_l = new ArrayList<>(addr);
             addr_l.add(false);
             ArrayList<Boolean> addr_r = new ArrayList<>(addr);
             addr_r.add(true);
             logHuffman(((HuffmanTree) h).left, addr_l);
             logHuffman(((HuffmanTree) h).right, addr_r);
         }
     }
     private ArrayList<String> getHuffmanStringList(RandomAccessFile file, Huffman huffman) throws IOException {
         ArrayList<String> results = new ArrayList<>();
         int number = file.readShort();
         Log.d(TAG, "huffmanStrings: " + number);
         for(int i=0; i<number; i++) {
             int l = file.readInt();
             byte[] str = new byte[l];
             file.read(str);
             results.add(new String(str, "UTF-8"));
             results.add(getHuffmanString(file, huffman));
         }
         return results;
     }
     private String getString(RandomAccessFile file) throws IOException {
         int l = file.readInt();
         byte[] str = new byte[l];
         file.read(str);
         return new String(str, "UTF-8");
     private ArrayList<Integer> getIntList(RandomAccessFile file) throws IOException {
         ArrayList<Integer> results = new ArrayList<>();
         int number = file.readShort();
         for(int i=0; i<number; i++) {
             results.add(Integer.valueOf(file.readByte()));
         }
         return results;
     }
     private Result getValue(RandomAccessFile file, long pos) throws IOException {
         file.seek(pos);
         ArrayList<String> kanjis = getStringList(file);
         Log.d(TAG, "Getting value");
         ArrayList<String> kanjis = getHuffmanStringList(file, kanjiHuffman);
         Log.d(TAG, "Getting readings");
         ArrayList<Result.Reading> readings = new ArrayList<>();
         int reading_number = file.readInt();
         int reading_number = file.readShort();
         Log.d(TAG, reading_number + " readings.");
         for(int i=0; i<reading_number; i++) {
             ArrayList<String> reading_kanjis = getStringList(file);
             Log.d(TAG, "kanjis: " + reading_kanjis);
             ArrayList<String> reading_infos = getStringList(file);
             ArrayList<String> reading_readings = getStringList(file);
             Log.d(TAG, "infos: " + reading_kanjis);
             ArrayList<String> reading_readings = getHuffmanStringList(file, readingHuffman);
             Result.Reading r = new Result.Reading(reading_kanjis, reading_infos, reading_readings);
             readings.add(r);
         }
         ArrayList<Result.Sense> senses = new ArrayList<>();
         int meaning_number = file.readInt();
         int meaning_number = file.readShort();
         Log.d(TAG, meaning_number + " meanings.");
         for(int i=0; i<meaning_number; i++) {
             ArrayList<String> sense_references = getStringList(file);
             ArrayList<String> sense_limits = getStringList(file);
             for(int j=0; j<source_number; j++) {
                 ArrayList<String> source_content = getStringList(file);
                 boolean source_wasei = file.read() != 0;
                 String source_type = getString(file);
                 String source_language = getString(file);
                 String source_type = file.readUTF();
                 String source_language = file.readUTF();
                 sense_sources.add(new Result.Source(source_content, source_wasei, source_type, source_language));
             }
             ArrayList<String> sense_tags = getStringList(file);
             ArrayList<String> sense_glosses = getStringList(file);
             String sense_language = getString(file);
             ArrayList<Integer> sense_tags = getIntList(file);
             ArrayList<String> sense_glosses = getHuffmanStringList(file, meaningHuffman);
             String sense_language = file.readUTF();
             senses.add(new Result.Sense(sense_references, sense_limits, sense_infos, sense_sources,
                     sense_tags, sense_glosses, sense_language));
         }
     private ArrayList<Integer> getValues(RandomAccessFile file, long triePos) throws IOException {
         file.seek(triePos);
         Log.d(TAG, "Getting value");
         int valuesLength = file.readInt();
         Log.d(TAG, "Getting values");
         int valuesLength = file.readShort();
         ArrayList<Integer> results = new ArrayList<>();
         Log.d(TAG, "Number of values: " + valuesLength);
             results.add(file.readInt());
         }
         int transitionLength = file.readInt();
         int transitionLength = file.readByte();
         Log.d(TAG, "Number of transitions: " + transitionLength);
         int[] others = new int[transitionLength];
         for(int i=0; i<transitionLength; i++) {
         if(txt.length == 0) {
             return getValues(file, triePos);
         } else {
             int valuesLength = file.readInt();
             int valuesLength = file.readShort();
             Log.d(TAG, "number of values: " + valuesLength);
             /*for(int i=0; i<valuesLength; i++) {
                 int strLen = file.readInt();
                 byte[] s = new byte[strLen];
                 file.read(s);
                 //Log.d(TAG, "Value of size " + strLen + ": " + new String(s, "UTF-8"));
                 file.skipBytes(strLen*4);
             }*/
             file.skipBytes(valuesLength * 4);
             int transitionLength = file.readInt();
             int transitionLength = file.readByte();
             Log.d(TAG, "number of transitions: " + transitionLength);
             for(int i = 0; i < transitionLength; i++) {
         }
     }
     private Huffman loadHuffman(RandomAccessFile file) throws IOException {
         byte b = file.readByte();
         if(b == 1) {
             Huffman left = loadHuffman(file);
             Huffman right = loadHuffman(file);
             return new HuffmanTree(left, right);
         } else if (b == 0) {
             file.skipBytes(1);
             return new HuffmanValue("");
         } else {
             ArrayList<Byte> bs = new ArrayList<>();
             bs.add(b);
             while((b = file.readByte()) != 0) {
                 bs.add(b);
             }
             byte[] array = new byte[bs.size()];
             for(int i=0; i<bs.size(); i++) {
                 array[i] = bs.get(i);
             }
             return new HuffmanValue(new String(array, "UTF-8"));
         }
     }
     ArrayList<Result> search(String text) {
         if (isDownloaded()) {
             try {
                 Log.d(TAG, "reading: " + readingTriePos);
                 Log.d(TAG, "meaning: " + meaningTriePos);
                 kanjiHuffman = loadHuffman(file);
                 readingHuffman = loadHuffman(file);
                 meaningHuffman = loadHuffman(file);
                 logHuffman(readingHuffman, new ArrayList<Boolean>());
                 ArrayList<Integer> results = searchTrie(file, kanjiTriePos, search);
                 if(results == null || results.isEmpty())
                     results = searchTrie(file, readingTriePos, search);
                         uniqResults.add(i);
                 }
                 for(Integer i: uniqResults) {
                 int[] uniqResultsArray = new int[uniqResults.size()];
                 Arrays.sort(uniqResultsArray);
                 int num = 0;
                 for(Integer i: uniqResultsArray) {
                     if(num > 10)
                         break;
                     num++;
                     r.add(getValue(file, i));
                 }
                 return r;

app/src/main/java/eu/lepiller/nani/result/Result.java

     }
     public static class Sense {
         private ArrayList<String> references, limits, infos, tags, glosses;
         private ArrayList<String> references, limits, infos, glosses;
         private ArrayList<Integer> tags;
         private String language;
         private ArrayList<Source> sources;
         public Sense(ArrayList<String> references, ArrayList<String> limits, ArrayList<String> infos,
                      ArrayList<Source> sources, ArrayList<String> tags, ArrayList<String> glosses,
                      ArrayList<Source> sources, ArrayList<Integer> tags, ArrayList<String> glosses,
                      String language) {
             this.references = references;
             this.limits = limits;

app/src/main/res/values/strings.xml

     <string name="kanji_description">Writing</string>
     <!-- Dictionnary descriptions -->
     <string name="dico_jmdict_example">Japanese/English dictionary for test purposes. Do not use.</string>
     <string name="dico_jmdict_e">Japanese/English dictionary from the Electronic Dictionary Research and Development Group.\n~80 MB, ~180,000 entries.</string>
     <string name="dico_jmdict_dut">Japanese/Dutch dictionary from the Electronic Dictionary Research and Development Group.\n~30 MB, ~35,000 entries.</string>
     <string name="dico_jmdict_fre">Japanese/French dictionary from the Electronic Dictionary Research and Development Group.\n~8 MB, ~15,000 entries.</string>
     <string name="dico_jmdict_ger">Japanese/German dictionary from the Electronic Dictionary Research and Development Group.\n~70 MB, ~120,000 entries.</string>
     <string name="dico_jmdict_hun">Japanese/Hungarian dictionary from the Electronic Dictionary Research and Development Group.\n~15 MB, ~40,000 entries.</string>
     <string name="dico_jmdict_rus">Japanese/Russian dictionary from the Electronic Dictionary Research and Development Group.\n~80 MB, ~65,000 entries.</string>
     <string name="dico_jmdict_slv">Japanese/Slovenian dictionary from the Electronic Dictionary Research and Development Group.\n~4 MB, ~9,000 entries.</string>
     <string name="dico_jmdict_spa">Japanese/Spanish dictionary from the Electronic Dictionary Research and Development Group.\n~15 MB, ~35,000 entries.</string>
     <string name="dico_jmdict_swe">Japanese/Swedish dictionary from the Electronic Dictionary Research and Development Group.\n~4 MB, ~15,000 entries.</string>
     <!-- Result view -->
     <string name="sense_number">%d.</string>