From 9a609dc71b03256860b746fd258e37624c54df71 Mon Sep 17 00:00:00 2001
From: Daniel Friesel <derf@finalrewind.org>
Date: Thu, 21 Jan 2021 21:47:29 +0100
Subject: this library implements inflate, not deflate

---
 README.md     |  43 +++---
 src/deflate.c | 465 ----------------------------------------------------------
 src/deflate.h |  23 ---
 src/inflate.c | 465 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 src/inflate.h |  23 +++
 5 files changed, 512 insertions(+), 507 deletions(-)
 delete mode 100644 src/deflate.c
 delete mode 100644 src/deflate.h
 create mode 100644 src/inflate.c
 create mode 100644 src/inflate.h

diff --git a/README.md b/README.md
index c7c0fd9..1ecbe90 100644
--- a/README.md
+++ b/README.md
@@ -11,12 +11,17 @@ for speed. Right now, the implementation is naive, but usable. See below for
 the current status and TODOs. Be aware that this library has not been
 extensively tested yet.
 
+Note: This library *inflates* (i.e., decompresses) data. The source files and
+API are named as such, as is the corresponding function in the original zlib
+implementation. However, as the algorithm is called *deflate*, the project is
+named zlib-*deflate*-nostdlib even though it does not support compression.
+
 ## Usage
 
-Embed `deflate.c` and `deflate.h` into your project. You can rename `deflate.c`
-to `deflate.cc` and/or compile it with g++ instead of gcc, if you like. Use
-`deflate_zlib(input, input_len, output, output_len)` to decompress zlib data,
-and `deflate(input, input_len, output, output_len)` to decompress deflate data
+Embed `inflate.c` and `inflate.h` into your project. You can rename `inflate.c`
+to `inflate.cc` and/or compile it with g++ instead of gcc, if you like. Use
+`inflate_zlib(input, input_len, output, output_len)` to decompress zlib data,
+and `inflate(input, input_len, output, output_len)` to decompress deflate data
 without zlib header.
 
 input and output must be `unsigned char *`, input\_len and output\_len are
@@ -26,24 +31,24 @@ bytes written to `output`, or a negative value on error.
 Example for zlib decompression (RFC 1950):
 
 ```
-#include "deflate.h"
+#include "inflate.h"
 
-unsigned char deflate_input[] = { /* some compressed data, e.g.: */
+unsigned char inflate_input[] = { /* some compressed data, e.g.: */
     120, 156, 243, 72, 205, 201, 201, 215, 81, 8, 207, 47, 202, 73, 177, 87,
     240, 64, 226, 41, 2, 0, 128, 125, 9, 17
 };
 
-unsigned char deflate_output[128];
+unsigned char inflate_output[128];
 
 // within some function
 {
-    int16_t out_bytes = deflate_zlib(deflate_input, sizeof(deflate_input),
-                                     deflate_output, sizeof(deflate_output));
+    int16_t out_bytes = inflate_zlib(inflate_input, sizeof(inflate_input),
+                                     inflate_output, sizeof(inflate_output));
     if (out_bytes < 0) {
         // error
     } else {
-        // success. deflate_output contains "Hello, World? Hello, World!"
-        // out_bytes contains the number of bytes written to deflate_output
+        // success. inflate_output contains "Hello, World? Hello, World!"
+        // out_bytes contains the number of bytes written to inflate_output
     }
 }
 
@@ -52,24 +57,24 @@ unsigned char deflate_output[128];
 Decompressing deflate (RFC 1951) data works as follows:
 
 ```
-#include "deflate.h"
+#include "inflate.h"
 
-unsigned char deflate_input[] = { /* some compressed data, e.g.: */
+unsigned char inflate_input[] = { /* some compressed data, e.g.: */
     243, 72, 205, 201, 201, 215, 81, 8, 207, 47, 202, 73, 177, 87,
     240, 64, 226, 41, 2, 0
 };
 
-unsigned char deflate_output[128];
+unsigned char inflate_output[128];
 
 // within some function
 {
-    int16_t out_bytes = deflate(deflate_input, sizeof(deflate_input),
-                                deflate_output, sizeof(deflate_output));
+    int16_t out_bytes = inflate(inflate_input, sizeof(inflate_input),
+                                inflate_output, sizeof(inflate_output));
     if (out_bytes < 0) {
         // error
     } else {
-        // success. deflate_output contains "Hello, World? Hello, World!"
-        // out_bytes contains the number of bytes written to deflate_output
+        // success. inflate_output contains "Hello, World? Hello, World!"
+        // out_bytes contains the number of bytes written to inflate_output
     }
 }
 
@@ -78,7 +83,7 @@ unsigned char deflate_output[128];
 ## Compilation flags
 
 Compile with `-DDEFLATE_CHECKSUM` to enable verification of the zlib ADLER32
-checksum in `deflate_zlib`.
+checksum in `inflate_zlib`.
 
 ## Compliance
 
diff --git a/src/deflate.c b/src/deflate.c
deleted file mode 100644
index 072cc97..0000000
--- a/src/deflate.c
+++ /dev/null
@@ -1,465 +0,0 @@
-/*
- * zlib-deflate-nostdlib
- *
- * Copyright 2021 Daniel Friesel
- *
- * SPDX-License-Identifier: BSD-2-Clause
- */
-
-#include "lib/deflate.h"
-
-/*
- * The compressed (inflated) input data.
- */
-unsigned char *deflate_input_now;
-unsigned char *deflate_input_end;
-
-/*
- * The decompressed (deflated) output stream.
- */
-unsigned char *deflate_output_now;
-unsigned char *deflate_output_end;
-
-/*
- * The current bit offset in the input stream, if any.
- *
- * Deflate streams are read from least to most significant bit.
- * An offset of 1 indicates that the least significant bit is skipped
- * (i.e., only bits 7, 6, 5, 4, 3, 2, and 1 are read).
- */
-uint8_t deflate_bit_offset = 0;
-
-/*
- * Base lengths for length codes (code 257 to 285).
- * Code 257 corresponds to a copy of 3 bytes, etc.
- */
-uint16_t const deflate_length_offsets[] = {
-	3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 15, 17, 19, 23, 27, 31, 35, 43, 51, 59,
-	67, 83, 99, 115, 131, 163, 195, 227, 258
-};
-
-/*
- * Extra bits for length codes (code 257 to 285).
- * Code 257 has no extra bits, code 265 has 1 extra bit
- * (and indicates a length of 11 or 12 depending on its value), etc.
- */
-uint8_t const deflate_length_bits[] = {
-	0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4,
-	5, 5, 5, 5, 0
-};
-
-// can also be expressed as (index < 4 || index == 28) ? 0 : (index-4) >> 2
-
-/*
- * Base distances for distance codes (code 0 to 29).
- * Code 0 indicates a distance of 1, etc.
- */
-uint16_t const deflate_distance_offsets[] = {
-	1, 2, 3, 4, 5, 7, 9, 13, 17, 25, 33, 49, 65, 97, 129, 193, 257, 385,
-	513, 769, 1025, 1537, 2049, 3073, 4097, 6145, 8193, 12289, 16385, 24577
-};
-
-/*
- * Extra bits for distance codes (code 0 to 29).
- * Code 0 has no extra bits, code 4 has 1 bit, etc.
- */
-uint8_t const deflate_distance_bits[] = {
-	0, 0, 0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9, 10,
-	10, 11, 11, 12, 12, 13, 13
-};
-
-// can also be expressed as index < 2 ? 0 : (index-2) >> 1
-
-/*
- * In block type 2 (dynamic huffman codes), the code lengths of literal/length
- * and distance alphabet are themselves stored as huffman codes. To save space
- * in case only a few code lengths are used, the code length codes are stored
- * in the following order. This allows a few bits to be saved if some code
- * lengths are unused and the unused code lengths are at the end of the list.
- */
-uint8_t const deflate_hclen_index[] = {
-	16, 17, 18, 0, 8, 7, 9, 6, 10, 5, 11, 4, 12, 3, 13, 2, 14, 1, 15
-};
-
-/*
- * Code lengths of the "code length" code (see above).
- */
-uint8_t deflate_hc_lengths[19];
-
-/*
- * Code lengths of the literal/length and distance alphabets.
- */
-uint8_t deflate_lld_lengths[318];
-
-/*
- * Assumptions:
- * * huffman code length is limited to 11 bits
- * * there are no more than 255 huffman codes with the same length
- *
- * Rationale: longer huffman codes might appear when handling large data
- * sets. We don't do that; instead, we expect the uncompressed source to
- * be no more than a few kB of data.
- */
-
-/*
- * Bit length counts and next code entries for Literal/Length alphabet.
- * Combined with the code lengths in deflate_lld_lengths, these make up the
- * Literal/Length alphabet. See the algorithm in RFC 1951 section 3.2.2 for
- * details.
- *
- * In deflate, these variables are also used for the huffman alphabet in
- * dynamic huffman blocks.
- */
-uint8_t deflate_bl_count_ll[12];
-uint16_t deflate_next_code_ll[12];
-
-/*
- * Bit length counts and next code entries for Distance alphabet.
- */
-uint8_t deflate_bl_count_d[12];
-uint16_t deflate_next_code_d[12];
-
-static uint16_t deflate_rev_word(uint16_t word, uint8_t bits)
-{
-	uint16_t ret = 0;
-	uint16_t mask = 1;
-	for (uint16_t rmask = 1 << (bits - 1); rmask > 0; rmask >>= 1) {
-		if (word & rmask) {
-			ret |= mask;
-		}
-		mask <<= 1;
-	}
-	return ret;
-}
-
-static uint8_t deflate_bitmask(uint8_t bit_count)
-{
-	return (1 << bit_count) - 1;
-}
-
-static uint16_t deflate_get_word()
-{
-	uint16_t ret = 0;
-	ret |= (deflate_input_now[0] >> deflate_bit_offset);
-	ret |= (uint16_t) deflate_input_now[1] << (8 - deflate_bit_offset);
-	if (deflate_bit_offset) {
-		ret |=
-		    (uint16_t) (deflate_input_now[2] &
-				deflate_bitmask(deflate_bit_offset)) << (16 -
-									 deflate_bit_offset);
-	}
-	return ret;
-}
-
-static uint16_t deflate_get_bits(uint8_t num_bits)
-{
-	uint16_t ret = deflate_get_word();
-	deflate_bit_offset += num_bits;
-	while (deflate_bit_offset >= 8) {
-		deflate_input_now++;
-		deflate_bit_offset -= 8;
-	}
-	return ret & deflate_bitmask(num_bits);
-}
-
-static void deflate_build_alphabet(uint8_t * lengths, uint16_t size,
-				   uint8_t * bl_count, uint16_t * next_code)
-{
-	uint16_t i;
-	uint16_t code = 0;
-	uint16_t max_len = 0;
-	for (i = 0; i < 12; i++) {
-		bl_count[i] = 0;
-	}
-
-	for (i = 0; i < size; i++) {
-		if (lengths[i]) {
-			bl_count[lengths[i]]++;
-		}
-		if (lengths[i] > max_len) {
-			max_len = lengths[i];
-		}
-	}
-
-	for (i = 1; i < max_len + 1; i++) {
-		code = (code + bl_count[i - 1]) << 1;
-		next_code[i] = code;
-	}
-}
-
-static uint16_t deflate_huff(uint8_t * lengths, uint16_t size,
-			     uint8_t * bl_count, uint16_t * next_code)
-{
-	uint16_t next_word = deflate_get_word();
-	for (uint8_t num_bits = 1; num_bits < 12; num_bits++) {
-		uint16_t next_bits = deflate_rev_word(next_word, num_bits);
-		if (bl_count[num_bits] && next_bits >= next_code[num_bits]
-		    && next_bits < next_code[num_bits] + bl_count[num_bits]) {
-			deflate_bit_offset += num_bits;
-			while (deflate_bit_offset >= 8) {
-				deflate_input_now++;
-				deflate_bit_offset -= 8;
-			}
-			uint8_t len_pos = next_bits;
-			uint8_t cur_pos = next_code[num_bits];
-			for (uint16_t i = 0; i < size; i++) {
-				if (lengths[i] == num_bits) {
-					if (cur_pos == len_pos) {
-						return i;
-					}
-					cur_pos++;
-				}
-			}
-		}
-	}
-	return 65535;
-}
-
-static int8_t deflate_huffman(uint8_t * ll_lengths, uint16_t ll_size,
-			      uint8_t * d_lengths, uint8_t d_size)
-{
-	uint16_t code;
-	uint16_t dcode;
-	while (1) {
-		code =
-		    deflate_huff(ll_lengths, ll_size, deflate_bl_count_ll,
-				 deflate_next_code_ll);
-		if (code < 256) {
-			if (deflate_output_now == deflate_output_end) {
-				return DEFLATE_ERR_OUTPUT_LENGTH;
-			}
-			*deflate_output_now = code;
-			deflate_output_now++;
-		} else if (code == 256) {
-			return 0;
-		} else {
-			uint16_t len_val = deflate_length_offsets[code - 257];
-			uint8_t extra_bits = deflate_length_bits[code - 257];
-			if (extra_bits) {
-				len_val += deflate_get_bits(extra_bits);
-			}
-			dcode =
-			    deflate_huff(d_lengths, d_size,
-					 deflate_bl_count_d,
-					 deflate_next_code_d);
-			uint16_t dist_val = deflate_distance_offsets[dcode];
-			extra_bits = deflate_distance_bits[dcode];
-			if (extra_bits) {
-				dist_val += deflate_get_bits(extra_bits);
-			}
-			while (len_val--) {
-				if (deflate_output_now == deflate_output_end) {
-					return DEFLATE_ERR_OUTPUT_LENGTH;
-				}
-				deflate_output_now[0] =
-				    *(deflate_output_now - dist_val);
-				deflate_output_now++;
-			}
-		}
-		if (deflate_input_now >= deflate_input_end - 4) {
-			return DEFLATE_ERR_INPUT_LENGTH;
-		}
-	}
-}
-
-static int8_t deflate_uncompressed()
-{
-	deflate_input_now++;
-	uint16_t len =
-	    ((uint16_t) deflate_input_now[1] << 8) + deflate_input_now[0];
-	uint16_t nlen =
-	    ((uint16_t) deflate_input_now[3] << 8) + deflate_input_now[2];
-	if (len & nlen) {
-		return DEFLATE_ERR_NLEN;
-	}
-	deflate_input_now += 4;
-	if (deflate_input_now + len >= deflate_input_end) {
-		return DEFLATE_ERR_INPUT_LENGTH;
-	}
-	if (deflate_output_now + len >= deflate_output_end) {
-		return DEFLATE_ERR_OUTPUT_LENGTH;
-	}
-	for (uint16_t i = 0; i < len; i++) {
-		*(deflate_output_now++) = *(deflate_input_now++);
-	}
-	return 0;
-}
-
-static int8_t deflate_static_huffman()
-{
-	uint16_t i;
-	for (i = 0; i <= 143; i++) {
-		deflate_lld_lengths[i] = 8;
-	}
-	for (i = 144; i <= 255; i++) {
-		deflate_lld_lengths[i] = 9;
-	}
-	for (i = 256; i <= 279; i++) {
-		deflate_lld_lengths[i] = 7;
-	}
-	for (i = 280; i <= 285; i++) {
-		deflate_lld_lengths[i] = 8;
-	}
-	for (i = 286; i <= 286 + 29; i++) {
-		deflate_lld_lengths[i] = 5;
-	}
-
-	deflate_build_alphabet(deflate_lld_lengths, 286, deflate_bl_count_ll,
-			       deflate_next_code_ll);
-	deflate_build_alphabet(deflate_lld_lengths + 286, 29,
-			       deflate_bl_count_d, deflate_next_code_d);
-	return deflate_huffman(deflate_lld_lengths, 286,
-			       deflate_lld_lengths + 286, 29);
-}
-
-static int8_t deflate_dynamic_huffman()
-{
-	uint8_t i;
-	uint16_t hlit = 257 + deflate_get_bits(5);
-	uint8_t hdist = 1 + deflate_get_bits(5);
-	uint8_t hclen = 4 + deflate_get_bits(4);
-
-	for (i = 0; i < hclen; i++) {
-		deflate_hc_lengths[deflate_hclen_index[i]] =
-		    deflate_get_bits(3);
-	}
-	for (i = hclen; i < sizeof(deflate_hc_lengths); i++) {
-		deflate_hc_lengths[deflate_hclen_index[i]] = 0;
-	}
-
-	deflate_build_alphabet(deflate_hc_lengths,
-			       sizeof(deflate_hc_lengths),
-			       deflate_bl_count_ll, deflate_next_code_ll);
-
-	uint16_t items_processed = 0;
-	while (items_processed < hlit + hdist) {
-		uint8_t code =
-		    deflate_huff(deflate_hc_lengths, 19, deflate_bl_count_ll,
-				 deflate_next_code_ll);
-		if (code == 16) {
-			uint8_t copy_count = 3 + deflate_get_bits(2);
-			for (uint8_t i = 0; i < copy_count; i++) {
-				deflate_lld_lengths[items_processed] =
-				    deflate_lld_lengths[items_processed - 1];
-				items_processed++;
-			}
-		} else if (code == 17) {
-			uint8_t null_count = 3 + deflate_get_bits(3);
-			for (uint8_t i = 0; i < null_count; i++) {
-				deflate_lld_lengths[items_processed] = 0;
-				items_processed++;
-			}
-		} else if (code == 18) {
-			uint8_t null_count = 11 + deflate_get_bits(7);
-			for (uint8_t i = 0; i < null_count; i++) {
-				deflate_lld_lengths[items_processed] = 0;
-				items_processed++;
-			}
-		} else {
-			deflate_lld_lengths[items_processed] = code;
-			items_processed++;
-		}
-	}
-
-	deflate_build_alphabet(deflate_lld_lengths, hlit,
-			       deflate_bl_count_ll, deflate_next_code_ll);
-	deflate_build_alphabet(deflate_lld_lengths + hlit, hdist,
-			       deflate_bl_count_d, deflate_next_code_d);
-
-	return deflate_huffman(deflate_lld_lengths, hlit,
-			       deflate_lld_lengths + hlit, hdist);
-}
-
-int16_t deflate(unsigned char *input_buf, uint16_t input_len,
-		unsigned char *output_buf, uint16_t output_len)
-{
-	//uint8_t is_final = input_buf[0] & 0x01;
-	uint8_t block_type = (input_buf[0] & 0x06) >> 1;
-	int8_t ret;
-
-	deflate_input_now = input_buf;
-	deflate_input_end = input_buf + input_len;
-	deflate_bit_offset = 3;
-
-	deflate_output_now = output_buf;
-	deflate_output_end = output_buf + output_len;
-
-	switch (block_type) {
-	case 0:
-		ret = deflate_uncompressed();
-		break;
-	case 1:
-		ret = deflate_static_huffman();
-		break;
-	case 2:
-		ret = deflate_dynamic_huffman();
-		break;
-	default:
-		return DEFLATE_ERR_BLOCK;
-	}
-
-	if (ret < 0) {
-		return ret;
-	}
-
-	return deflate_output_now - output_buf;
-}
-
-int16_t deflate_zlib(unsigned char *input_buf, uint16_t input_len,
-		     unsigned char *output_buf, uint16_t output_len)
-{
-	if (input_len < 4) {
-		return DEFLATE_ERR_INPUT_LENGTH;
-	}
-	uint8_t zlib_method = input_buf[0] & 0x0f;
-	uint8_t zlib_flags = input_buf[1];
-
-	if (zlib_method != 8) {
-		return DEFLATE_ERR_METHOD;
-	}
-
-	if (zlib_flags & 0x20) {
-		return DEFLATE_ERR_FDICT;
-	}
-
-	if ((((uint16_t) input_buf[0] << 8) | input_buf[1]) % 31) {
-		return DEFLATE_ERR_FCHECK;
-	}
-
-	int16_t ret =
-	    deflate(input_buf + 2, input_len - 2, output_buf, output_len);
-
-#ifdef DEFLATE_CHECKSUM
-	if (ret >= 0) {
-		uint16_t deflate_s1 = 1;
-		uint16_t deflate_s2 = 0;
-
-		deflate_output_end = deflate_output_now;
-		for (deflate_output_now = output_buf;
-		     deflate_output_now < deflate_output_end;
-		     deflate_output_now++) {
-			deflate_s1 =
-			    ((uint32_t) deflate_s1 +
-			     (uint32_t) (*deflate_output_now)) % 65521;
-			deflate_s2 =
-			    ((uint32_t) deflate_s2 +
-			     (uint32_t) deflate_s1) % 65521;
-		}
-
-		if (deflate_bit_offset) {
-			deflate_input_now++;
-		}
-
-		if ((deflate_s2 !=
-		     (((uint16_t) deflate_input_now[0] << 8) | (uint16_t)
-		      deflate_input_now[1]))
-		    || (deflate_s1 !=
-			(((uint16_t) deflate_input_now[2] << 8) | (uint16_t)
-			 deflate_input_now[3]))) {
-			return DEFLATE_ERR_CHECKSUM;
-		}
-	}
-#endif
-
-	return ret;
-}
diff --git a/src/deflate.h b/src/deflate.h
deleted file mode 100644
index 4ed28a0..0000000
--- a/src/deflate.h
+++ /dev/null
@@ -1,23 +0,0 @@
-/*
- * zlib-deflate-nostdlib
- *
- * Copyright 2021 Daniel Friesel
- *
- * SPDX-License-Identifier: BSD-2-Clause
- */
-
-#include <stdint.h>
-
-#define DEFLATE_ERR_INPUT_LENGTH (-1)
-#define DEFLATE_ERR_METHOD (-2)
-#define DEFLATE_ERR_FDICT (-3)
-#define DEFLATE_ERR_BLOCK (-4)
-#define DEFLATE_ERR_CHECKSUM (-5)
-#define DEFLATE_ERR_OUTPUT_LENGTH (-6)
-#define DEFLATE_ERR_FCHECK (-7)
-#define DEFLATE_ERR_NLEN (-8)
-
-int16_t deflate(unsigned char *input_buf, uint16_t input_len,
-		unsigned char *output_buf, uint16_t output_len);
-int16_t deflate_zlib(unsigned char *input_buf, uint16_t input_len,
-		     unsigned char *output_buf, uint16_t output_len);
diff --git a/src/inflate.c b/src/inflate.c
new file mode 100644
index 0000000..8e83453
--- /dev/null
+++ b/src/inflate.c
@@ -0,0 +1,465 @@
+/*
+ * zlib-deflate-nostdlib
+ *
+ * Copyright 2021 Daniel Friesel
+ *
+ * SPDX-License-Identifier: BSD-2-Clause
+ */
+
+#include "lib/inflate.h"
+
+/*
+ * The compressed (inflated) input data.
+ */
+unsigned char *deflate_input_now;
+unsigned char *deflate_input_end;
+
+/*
+ * The decompressed (deflated) output stream.
+ */
+unsigned char *deflate_output_now;
+unsigned char *deflate_output_end;
+
+/*
+ * The current bit offset in the input stream, if any.
+ *
+ * Deflate streams are read from least to most significant bit.
+ * An offset of 1 indicates that the least significant bit is skipped
+ * (i.e., only bits 7, 6, 5, 4, 3, 2, and 1 are read).
+ */
+uint8_t deflate_bit_offset = 0;
+
+/*
+ * Base lengths for length codes (code 257 to 285).
+ * Code 257 corresponds to a copy of 3 bytes, etc.
+ */
+uint16_t const deflate_length_offsets[] = {
+	3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 15, 17, 19, 23, 27, 31, 35, 43, 51, 59,
+	67, 83, 99, 115, 131, 163, 195, 227, 258
+};
+
+/*
+ * Extra bits for length codes (code 257 to 285).
+ * Code 257 has no extra bits, code 265 has 1 extra bit
+ * (and indicates a length of 11 or 12 depending on its value), etc.
+ */
+uint8_t const deflate_length_bits[] = {
+	0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4,
+	5, 5, 5, 5, 0
+};
+
+// can also be expressed as (index < 4 || index == 28) ? 0 : (index-4) >> 2
+
+/*
+ * Base distances for distance codes (code 0 to 29).
+ * Code 0 indicates a distance of 1, etc.
+ */
+uint16_t const deflate_distance_offsets[] = {
+	1, 2, 3, 4, 5, 7, 9, 13, 17, 25, 33, 49, 65, 97, 129, 193, 257, 385,
+	513, 769, 1025, 1537, 2049, 3073, 4097, 6145, 8193, 12289, 16385, 24577
+};
+
+/*
+ * Extra bits for distance codes (code 0 to 29).
+ * Code 0 has no extra bits, code 4 has 1 bit, etc.
+ */
+uint8_t const deflate_distance_bits[] = {
+	0, 0, 0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9, 10,
+	10, 11, 11, 12, 12, 13, 13
+};
+
+// can also be expressed as index < 2 ? 0 : (index-2) >> 1
+
+/*
+ * In block type 2 (dynamic huffman codes), the code lengths of literal/length
+ * and distance alphabet are themselves stored as huffman codes. To save space
+ * in case only a few code lengths are used, the code length codes are stored
+ * in the following order. This allows a few bits to be saved if some code
+ * lengths are unused and the unused code lengths are at the end of the list.
+ */
+uint8_t const deflate_hclen_index[] = {
+	16, 17, 18, 0, 8, 7, 9, 6, 10, 5, 11, 4, 12, 3, 13, 2, 14, 1, 15
+};
+
+/*
+ * Code lengths of the "code length" code (see above).
+ */
+uint8_t deflate_hc_lengths[19];
+
+/*
+ * Code lengths of the literal/length and distance alphabets.
+ */
+uint8_t deflate_lld_lengths[318];
+
+/*
+ * Assumptions:
+ * * huffman code length is limited to 11 bits
+ * * there are no more than 255 huffman codes with the same length
+ *
+ * Rationale: longer huffman codes might appear when handling large data
+ * sets. We don't do that; instead, we expect the uncompressed source to
+ * be no more than a few kB of data.
+ */
+
+/*
+ * Bit length counts and next code entries for Literal/Length alphabet.
+ * Combined with the code lengths in deflate_lld_lengths, these make up the
+ * Literal/Length alphabet. See the algorithm in RFC 1951 section 3.2.2 for
+ * details.
+ *
+ * In deflate, these variables are also used for the huffman alphabet in
+ * dynamic huffman blocks.
+ */
+uint8_t deflate_bl_count_ll[12];
+uint16_t deflate_next_code_ll[12];
+
+/*
+ * Bit length counts and next code entries for Distance alphabet.
+ */
+uint8_t deflate_bl_count_d[12];
+uint16_t deflate_next_code_d[12];
+
+static uint16_t deflate_rev_word(uint16_t word, uint8_t bits)
+{
+	uint16_t ret = 0;
+	uint16_t mask = 1;
+	for (uint16_t rmask = 1 << (bits - 1); rmask > 0; rmask >>= 1) {
+		if (word & rmask) {
+			ret |= mask;
+		}
+		mask <<= 1;
+	}
+	return ret;
+}
+
+static uint8_t deflate_bitmask(uint8_t bit_count)
+{
+	return (1 << bit_count) - 1;
+}
+
+static uint16_t deflate_get_word()
+{
+	uint16_t ret = 0;
+	ret |= (deflate_input_now[0] >> deflate_bit_offset);
+	ret |= (uint16_t) deflate_input_now[1] << (8 - deflate_bit_offset);
+	if (deflate_bit_offset) {
+		ret |=
+		    (uint16_t) (deflate_input_now[2] &
+				deflate_bitmask(deflate_bit_offset)) << (16 -
+									 deflate_bit_offset);
+	}
+	return ret;
+}
+
+static uint16_t deflate_get_bits(uint8_t num_bits)
+{
+	uint16_t ret = deflate_get_word();
+	deflate_bit_offset += num_bits;
+	while (deflate_bit_offset >= 8) {
+		deflate_input_now++;
+		deflate_bit_offset -= 8;
+	}
+	return ret & deflate_bitmask(num_bits);
+}
+
+static void deflate_build_alphabet(uint8_t * lengths, uint16_t size,
+				   uint8_t * bl_count, uint16_t * next_code)
+{
+	uint16_t i;
+	uint16_t code = 0;
+	uint16_t max_len = 0;
+	for (i = 0; i < 12; i++) {
+		bl_count[i] = 0;
+	}
+
+	for (i = 0; i < size; i++) {
+		if (lengths[i]) {
+			bl_count[lengths[i]]++;
+		}
+		if (lengths[i] > max_len) {
+			max_len = lengths[i];
+		}
+	}
+
+	for (i = 1; i < max_len + 1; i++) {
+		code = (code + bl_count[i - 1]) << 1;
+		next_code[i] = code;
+	}
+}
+
+static uint16_t deflate_huff(uint8_t * lengths, uint16_t size,
+			     uint8_t * bl_count, uint16_t * next_code)
+{
+	uint16_t next_word = deflate_get_word();
+	for (uint8_t num_bits = 1; num_bits < 12; num_bits++) {
+		uint16_t next_bits = deflate_rev_word(next_word, num_bits);
+		if (bl_count[num_bits] && next_bits >= next_code[num_bits]
+		    && next_bits < next_code[num_bits] + bl_count[num_bits]) {
+			deflate_bit_offset += num_bits;
+			while (deflate_bit_offset >= 8) {
+				deflate_input_now++;
+				deflate_bit_offset -= 8;
+			}
+			uint8_t len_pos = next_bits;
+			uint8_t cur_pos = next_code[num_bits];
+			for (uint16_t i = 0; i < size; i++) {
+				if (lengths[i] == num_bits) {
+					if (cur_pos == len_pos) {
+						return i;
+					}
+					cur_pos++;
+				}
+			}
+		}
+	}
+	return 65535;
+}
+
+static int8_t deflate_huffman(uint8_t * ll_lengths, uint16_t ll_size,
+			      uint8_t * d_lengths, uint8_t d_size)
+{
+	uint16_t code;
+	uint16_t dcode;
+	while (1) {
+		code =
+		    deflate_huff(ll_lengths, ll_size, deflate_bl_count_ll,
+				 deflate_next_code_ll);
+		if (code < 256) {
+			if (deflate_output_now == deflate_output_end) {
+				return DEFLATE_ERR_OUTPUT_LENGTH;
+			}
+			*deflate_output_now = code;
+			deflate_output_now++;
+		} else if (code == 256) {
+			return 0;
+		} else {
+			uint16_t len_val = deflate_length_offsets[code - 257];
+			uint8_t extra_bits = deflate_length_bits[code - 257];
+			if (extra_bits) {
+				len_val += deflate_get_bits(extra_bits);
+			}
+			dcode =
+			    deflate_huff(d_lengths, d_size,
+					 deflate_bl_count_d,
+					 deflate_next_code_d);
+			uint16_t dist_val = deflate_distance_offsets[dcode];
+			extra_bits = deflate_distance_bits[dcode];
+			if (extra_bits) {
+				dist_val += deflate_get_bits(extra_bits);
+			}
+			while (len_val--) {
+				if (deflate_output_now == deflate_output_end) {
+					return DEFLATE_ERR_OUTPUT_LENGTH;
+				}
+				deflate_output_now[0] =
+				    *(deflate_output_now - dist_val);
+				deflate_output_now++;
+			}
+		}
+		if (deflate_input_now >= deflate_input_end - 4) {
+			return DEFLATE_ERR_INPUT_LENGTH;
+		}
+	}
+}
+
+static int8_t deflate_uncompressed()
+{
+	deflate_input_now++;
+	uint16_t len =
+	    ((uint16_t) deflate_input_now[1] << 8) + deflate_input_now[0];
+	uint16_t nlen =
+	    ((uint16_t) deflate_input_now[3] << 8) + deflate_input_now[2];
+	if (len & nlen) {
+		return DEFLATE_ERR_NLEN;
+	}
+	deflate_input_now += 4;
+	if (deflate_input_now + len >= deflate_input_end) {
+		return DEFLATE_ERR_INPUT_LENGTH;
+	}
+	if (deflate_output_now + len >= deflate_output_end) {
+		return DEFLATE_ERR_OUTPUT_LENGTH;
+	}
+	for (uint16_t i = 0; i < len; i++) {
+		*(deflate_output_now++) = *(deflate_input_now++);
+	}
+	return 0;
+}
+
+static int8_t deflate_static_huffman()
+{
+	uint16_t i;
+	for (i = 0; i <= 143; i++) {
+		deflate_lld_lengths[i] = 8;
+	}
+	for (i = 144; i <= 255; i++) {
+		deflate_lld_lengths[i] = 9;
+	}
+	for (i = 256; i <= 279; i++) {
+		deflate_lld_lengths[i] = 7;
+	}
+	for (i = 280; i <= 285; i++) {
+		deflate_lld_lengths[i] = 8;
+	}
+	for (i = 286; i <= 286 + 29; i++) {
+		deflate_lld_lengths[i] = 5;
+	}
+
+	deflate_build_alphabet(deflate_lld_lengths, 286, deflate_bl_count_ll,
+			       deflate_next_code_ll);
+	deflate_build_alphabet(deflate_lld_lengths + 286, 29,
+			       deflate_bl_count_d, deflate_next_code_d);
+	return deflate_huffman(deflate_lld_lengths, 286,
+			       deflate_lld_lengths + 286, 29);
+}
+
+static int8_t deflate_dynamic_huffman()
+{
+	uint8_t i;
+	uint16_t hlit = 257 + deflate_get_bits(5);
+	uint8_t hdist = 1 + deflate_get_bits(5);
+	uint8_t hclen = 4 + deflate_get_bits(4);
+
+	for (i = 0; i < hclen; i++) {
+		deflate_hc_lengths[deflate_hclen_index[i]] =
+		    deflate_get_bits(3);
+	}
+	for (i = hclen; i < sizeof(deflate_hc_lengths); i++) {
+		deflate_hc_lengths[deflate_hclen_index[i]] = 0;
+	}
+
+	deflate_build_alphabet(deflate_hc_lengths,
+			       sizeof(deflate_hc_lengths),
+			       deflate_bl_count_ll, deflate_next_code_ll);
+
+	uint16_t items_processed = 0;
+	while (items_processed < hlit + hdist) {
+		uint8_t code =
+		    deflate_huff(deflate_hc_lengths, 19, deflate_bl_count_ll,
+				 deflate_next_code_ll);
+		if (code == 16) {
+			uint8_t copy_count = 3 + deflate_get_bits(2);
+			for (uint8_t i = 0; i < copy_count; i++) {
+				deflate_lld_lengths[items_processed] =
+				    deflate_lld_lengths[items_processed - 1];
+				items_processed++;
+			}
+		} else if (code == 17) {
+			uint8_t null_count = 3 + deflate_get_bits(3);
+			for (uint8_t i = 0; i < null_count; i++) {
+				deflate_lld_lengths[items_processed] = 0;
+				items_processed++;
+			}
+		} else if (code == 18) {
+			uint8_t null_count = 11 + deflate_get_bits(7);
+			for (uint8_t i = 0; i < null_count; i++) {
+				deflate_lld_lengths[items_processed] = 0;
+				items_processed++;
+			}
+		} else {
+			deflate_lld_lengths[items_processed] = code;
+			items_processed++;
+		}
+	}
+
+	deflate_build_alphabet(deflate_lld_lengths, hlit,
+			       deflate_bl_count_ll, deflate_next_code_ll);
+	deflate_build_alphabet(deflate_lld_lengths + hlit, hdist,
+			       deflate_bl_count_d, deflate_next_code_d);
+
+	return deflate_huffman(deflate_lld_lengths, hlit,
+			       deflate_lld_lengths + hlit, hdist);
+}
+
+int16_t inflate(unsigned char *input_buf, uint16_t input_len,
+		unsigned char *output_buf, uint16_t output_len)
+{
+	//uint8_t is_final = input_buf[0] & 0x01;
+	uint8_t block_type = (input_buf[0] & 0x06) >> 1;
+	int8_t ret;
+
+	deflate_input_now = input_buf;
+	deflate_input_end = input_buf + input_len;
+	deflate_bit_offset = 3;
+
+	deflate_output_now = output_buf;
+	deflate_output_end = output_buf + output_len;
+
+	switch (block_type) {
+	case 0:
+		ret = deflate_uncompressed();
+		break;
+	case 1:
+		ret = deflate_static_huffman();
+		break;
+	case 2:
+		ret = deflate_dynamic_huffman();
+		break;
+	default:
+		return DEFLATE_ERR_BLOCK;
+	}
+
+	if (ret < 0) {
+		return ret;
+	}
+
+	return deflate_output_now - output_buf;
+}
+
+int16_t inflate_zlib(unsigned char *input_buf, uint16_t input_len,
+		     unsigned char *output_buf, uint16_t output_len)
+{
+	if (input_len < 4) {
+		return DEFLATE_ERR_INPUT_LENGTH;
+	}
+	uint8_t zlib_method = input_buf[0] & 0x0f;
+	uint8_t zlib_flags = input_buf[1];
+
+	if (zlib_method != 8) {
+		return DEFLATE_ERR_METHOD;
+	}
+
+	if (zlib_flags & 0x20) {
+		return DEFLATE_ERR_FDICT;
+	}
+
+	if ((((uint16_t) input_buf[0] << 8) | input_buf[1]) % 31) {
+		return DEFLATE_ERR_FCHECK;
+	}
+
+	int16_t ret =
+	    inflate(input_buf + 2, input_len - 2, output_buf, output_len);
+
+#ifdef DEFLATE_CHECKSUM
+	if (ret >= 0) {
+		uint16_t deflate_s1 = 1;
+		uint16_t deflate_s2 = 0;
+
+		deflate_output_end = deflate_output_now;
+		for (deflate_output_now = output_buf;
+		     deflate_output_now < deflate_output_end;
+		     deflate_output_now++) {
+			deflate_s1 =
+			    ((uint32_t) deflate_s1 +
+			     (uint32_t) (*deflate_output_now)) % 65521;
+			deflate_s2 =
+			    ((uint32_t) deflate_s2 +
+			     (uint32_t) deflate_s1) % 65521;
+		}
+
+		if (deflate_bit_offset) {
+			deflate_input_now++;
+		}
+
+		if ((deflate_s2 !=
+		     (((uint16_t) deflate_input_now[0] << 8) | (uint16_t)
+		      deflate_input_now[1]))
+		    || (deflate_s1 !=
+			(((uint16_t) deflate_input_now[2] << 8) | (uint16_t)
+			 deflate_input_now[3]))) {
+			return DEFLATE_ERR_CHECKSUM;
+		}
+	}
+#endif
+
+	return ret;
+}
diff --git a/src/inflate.h b/src/inflate.h
new file mode 100644
index 0000000..575be4a
--- /dev/null
+++ b/src/inflate.h
@@ -0,0 +1,23 @@
+/*
+ * zlib-deflate-nostdlib
+ *
+ * Copyright 2021 Daniel Friesel
+ *
+ * SPDX-License-Identifier: BSD-2-Clause
+ */
+
+#include <stdint.h>
+
+#define DEFLATE_ERR_INPUT_LENGTH (-1)
+#define DEFLATE_ERR_METHOD (-2)
+#define DEFLATE_ERR_FDICT (-3)
+#define DEFLATE_ERR_BLOCK (-4)
+#define DEFLATE_ERR_CHECKSUM (-5)
+#define DEFLATE_ERR_OUTPUT_LENGTH (-6)
+#define DEFLATE_ERR_FCHECK (-7)
+#define DEFLATE_ERR_NLEN (-8)
+
+int16_t inflate(unsigned char *input_buf, uint16_t input_len,
+		unsigned char *output_buf, uint16_t output_len);
+int16_t inflate_zlib(unsigned char *input_buf, uint16_t input_len,
+		     unsigned char *output_buf, uint16_t output_len);
-- 
cgit v1.2.3