依赖

<dependency>
    <groupId>org.bytedeco</groupId>
    <artifactId>tesseract-platform</artifactId>
    <version>4.1.1-1.5.5</version>
</dependency>

代码

只测试了简体中文chi_sim和英文eng

package com.colin.tool.img;

import org.bytedeco.javacpp.BytePointer;
import org.bytedeco.leptonica.PIX;
import org.bytedeco.leptonica.global.lept;
import org.bytedeco.tesseract.TessBaseAPI;

/**
 * @author colin.cheng
 * @date 2022-01-17
 * @since 1.0.0
 */
public class ImageUtil {

    public static String ocr(String imagePath, OcrLanguage language) {
        TessBaseAPI api=new TessBaseAPI();
        if (api.Init(language.getPath(), language.getLangName()) != 0) {
            api.End();
            return "";
        }
        PIX image = lept.pixRead(imagePath);
        if (image == null) {
            return "";
        }
        api.SetImage(image);
        BytePointer outText=api.GetUTF8Text();
        String result=outText.getString();
        api.End();
        outText.deallocate();
        lept.pixDestroy(image);
        return result;
    }

    public static void main(String[] args) {
        String text = ocr("F:\\test\\img\\0.jpg", OcrLanguage.ZH_CN);
        System.out.println(text);
    }

    public enum OcrLanguage {
        /** 简体中文 */
        ZH_CN("chi_sim", "F:\\test\\img\\traineddata"),
        /** 英文 */
        EN("eng", "F:\\test\\img\\traineddata");

        /** 文件名 */
        private String langName;
        /** 所在文件夹 */
        private String path;

        OcrLanguage(String langName, String path) {
            this.langName = langName;
            this.path = path;
        }

        public String getLangName() {
            return langName;
        }

        public String getPath() {
            return path;
        }
    }
}